妹尾 卓磨

Seno Takuma

Message

スターウォーズが大好きでR2-D2を作るのが夢です。現在は慶應大学今井研究室で深層強化学習の研究を行っています。エージェントが好奇心に基づいて環境を探索するなどの、自分で自分自身の学習を促す手法が今後の強化学習の肝になると考えているので、その方面で研究しています。

Biography

  • 2014年3月 慶應義塾高等学校 卒業.
  • 2014年4月 慶應義塾大学 理工学部 入学.
  • 2016年6月 UC Berkeley Summer Session CS61C
  • 2018年3月 慶應義塾大学 理工学部 卒業
  • 2018年4月 慶應義塾大学大学院 理工学研究科 開放環境専攻 入学
  • 2019年9月 慶應義塾大学大学院 理工学研究科 開放環境専攻 修士課程修了
  • 2019年9月 慶應義塾大学大学院 理工学研究科 開放環境専攻 博士課程

現在同大学院博士過程(今井研究室所属)

Internships

  • 沖縄科学技術大学院大学(神経計算ユニット Research Assistant)
  • SONY株式会社(R/&/gDセンター 深層エンジニアアルバイト)
  • ギリア株式会社(機械学習R&Dエンジニアアルバイト)
  • SONY株式会社(R&Dセンター 機械エンジニアインターン)
  • Wantedly株式会社(Web/機械学習エンジニア)
  • SONY株式会社(UX開発本部クラウドエンジニア)
  • マッチングッド株式会社(クラウドエンジニア)

Awards

  • 2020年 情報処理推進機構(IPA)未踏IT人材発掘・育成事業採択
  • 2019年 第29回日本神経回路学会全国大会 大会奨励賞
  • 2018年 第4回全脳アーキテクチャハッカソン 優秀賞&ふるや総合会計事務所AGI賞
  • 2018年 第80回情報処理学会全国大会 学生奨励賞 「深層強化学習によるロボットの無報酬な環境の探索」
  • 2017年 HAIシンポジウム2017 学生奨励賞 「予測的認知と「間」の関係 ―言葉を話せないロボットによるしりとりを題材とした考察―」
  • 2017年 第3回全脳アーキテクチャハッカソン 最優秀賞

Publications

国際会議

[3] Takuma Seno, Kohei Okuoka, Masahiko Osawa, Michita Imai, "Adaptive Semi-autonomous Agents via Episodic Control", 6th International Conference on Human-Agent Interaction (Poster), 2018
[2] Takuma Seno, Masahiko Osawa, Michita Imai, "An Intrinsically Motivated Robot Explores Non-reward Environments With Output Arbitration", Annual International Conference on Biologically Inspired Cognitive Architectures, 2018
[1] Masahiko Osawa, Yuta Ashihara, Takuma Seno, Michita Imai, Satoshi Kurihara, Accumulator Based Arbitration Model for both Supervised Learning and Reinforcement Learning Inspired by Prefrontal Cortex, ICONIP2017.

国内会議

[10] 妹尾卓磨, 大澤正彦, 今井倫太, “微分可能メモリを用いた方策勾配法の安定化”, 第29回神経回路学会全国大会, 2019. (口頭発表)
[9] 阿部佑樹, 妹尾卓磨, 松森匠哉, 今井倫太, “画像キャプショニングに対する表現学習に向けた敵対的生成ネットワーク”, 人工知能学会, 2019.
[8] 阿部佑樹, 松森匠哉, 妹尾卓磨, 今井倫太, “条件付き画像キャプショニングに向けた敵対的生成ネットワークの検討”, HAIシンポジウム, 2018.
[7] 石川敬規, 妹尾卓磨, 今井倫太, “複数の潜在変数を用いた表現学習モデルMPVAEの提案”, HAIシンポジウム, 2018.
[6] Takuma Seno, Masahiko Osawa, Michita Imai, “Dynamic NOOP Insertion Improves Performance of Pre-trained Deep Reinforcement Learning Model”, 28th Annual Conference of Japanese Neural Network Society, 2018.
[5] 妹尾卓磨, 大澤正彦, 今井倫太, “深層強化学習によるロボットの無報酬な環境の探索”, 第80回情報処理学会全国大会, 2018.
[4] 松森匠哉, 妹尾卓磨, 菊池俊基, 滝本佑介, 大澤正彦, 今井倫太, “Embedding Cognitive Map in Neural Episodic Control”, 第7回汎用人工知能研究会, 2017.
[3] 大藤聖菜, 妹尾卓磨, 清丸寛一, 川崎邦将, 大澤正彦, 長田茂美, 今井倫太, “予測的認知と「間」の関係 ―言葉を話せないロボットによるしりとりを題材とした考察―”, HAIシンポジウム, 2017.
[2] 妹尾卓磨, 大澤正彦, 今井倫太, “無報酬な環境での深層強化学習によるロボットの行動獲得”, HAIシンポジウム, 2017.
[1] 妹尾卓磨, 大澤正彦, 今井倫太, “Accumulator Based Arbitration Model DQN: 複数モジュールを調停した深層強化学習手法”, 第27回神経回路学会全国大会, 2017. (口頭発表)

Activity in WBA