連続セミナー2025「AIが拓く次世代イノベーション」」
-
オープニング
佐藤 洋一(東京大学)
-
Session1「動画とテキストからの手順理解:手作業プロセスの革新に向けた現在地」
少子高齢化による労働力不足が懸念される状況は、世界中の多くの先進国で見られます。そのため、科学実験や製品の組み立てなどの高価値タスクを自動化するための視覚言語融合(Vision & Language)および関連技術に対する注目が高まっています。本講演では、手続き的なテキストと動画データからの人間行動の理解に焦点を当て、その応用や技術的課題、社会活用の展望について解説します。たとえば、作業動画に対するキャプション生成では、一般的な動画キャプションよりも詳細に作業内容を描写する必要があります。また、作業をロボットに代替させることを目的として、手順書や動画からロボットのタスクや動作計画を生成する取り組みも始まっています。本講演では、このような状況に対する国内外の最新の研究状況を紹介するとともに、今後の展望についても語ります。
橋本敦史(オムロン サイニックエックス株式会社)
【略歴】平17京大.工・情報卒.平25京大大学院情報学研究科にて博士(情報学)取得. 同大で助教を努めたのち、現在はオムロン サイニックエックス株式会社においてKnowledge Computing Groupを主宰. 主に画像認識,機械学習,クロスモーダル処理,および,ヒューマンコンピュータインタラクションに関わる研究に従事. IEEE, ACM, 電子情報通信学会,情報処理学会各会員. -
休憩
-
Session2「3D身体モデル基盤と画像からの再構成」
大川武彦(東京大学大学院情報理工学系研究科電子情報学専攻博士3年)
-
休憩
-
Session3 「音楽家の超絶技巧の原理解明と熟達支援を可能にするテクノロジー」
古屋晋一(株式会社ソニーコンピュータサイエンス研究所)
-
クロージング
佐藤 洋一(東京大学)