第1回:
AIと歩む未来(1):自然言語処理の最新動向

日時:2019年6月26日(水) 10:00~17:00
会場:理化学研究所 革新知能統合研究センター 日本橋一丁目三井ビルディング15F 会議室1~4(東京会場)
   大阪大学中之島センター7F 講義室702(大阪会場)
   東北大学電気通信研究所 本館1階 オープンセミナールーム(東北会場)
受付開始:9:30~

深層学習の出現によって、自然言語処理の研究も大きな発展がもたらされました。一般的なドメインにおける機械翻訳の精度は飛躍的に向上し、対話システム、情報検索、情報抽出といった技術も進歩してきました。しかし、深層学習では大規模なトレーニングデータが必要であったり、解釈の難しさなどの課題が残っています。また、深層学習では対応できない領域や、深層学習を補完するべき技術についても更なる研究が必要とされています。そこにはやはり、人間の言語処理の分析、知識の必要性などの課題があり、さて自然言語処理とは一体何を目指しているのかという根源的な問いも存在します。そういった研究の最前線にいる研究者に講演をいただき、今後の自然言語処理の進むべき道について議論したいと思います。
オープニング[10:00-10:10]

コーディネータ:関根 聡

理化学研究所 革新知能統合研究センター(AIP)

【略歴】理化学研究所AIP・言語情報アクセスチームチームリーダー、ニューヨーク大学研究准教授、合同会社ランゲージ・クラフト主任研究員。1992年英国マンチェスター大学計算言語学部修士号。1998年ニューヨーク大学コンピューターサイエンス学部博士号。松下電業産業株式会社(現パナソニック)、ソニーCSL、マイクロソフト研究所、楽天技術研究所ニューヨークなどでの研究職を歴任。専門は自然言語処理。特に情報抽出、固有表現抽出、質問応答、情報アクセスの研究に興味を持つ。情報処理学会自然言語処理研究会主査、その他役職多数。複数の企業の技術顧問なども兼任。

セッション1[10:10-11:00]

言語生成技術の最新動向

センサの普及やストレージの拡充により、金融データ、生理指標データ、人間の行動データなどを含む様々なデータが、数値データ、カテゴリカルデータ、テキストデータなど様々な形式で大量に蓄積されている。このようなデータを効果的に活用するために、コンピュータによりデータを解釈し、それを言語表現(テキスト)という形で人間に提示する技術、すなわち言語生成技術の発展が望まれている。本発表では、ニューラルネットワークの発展により大きく進んだ言語生成技術を外観し、いくつかの研究例を紹介する。また、長い歴史のある言語生成技術の研究を振り返りつつ、今後の言語生成技術のさらなる発展に何が必要かについて議論する。

講師:高村 大也

国立研究開発法人産業技術総合研究所 人工知能研究センター 研究チーム長/東京工業大学 教授

【略歴】1997年東京大学工学部計数工学科卒業。2000年同大大学院工学系研究科計数工学専攻修了(1999年はオーストリアウィーン工科大学にて研究)。2003年奈良先端科学技術大学院大学情報科学研究科博士課程修了。博士(工学)。2003年から2010年まで東京工業大学精密工学研究所助教。2006年にはイリノイ大学にて客員研究員。2010年から2016年まで同准教授。2017年より同教授および産業技術総合研究所人工知能センター知識情報研究チーム研究チーム長。計算言語学、自然言語処理を専門とし、特に機械学習の応用に興味を持つ。

セッション2[11:00-11:50]

言語認識過程に対する自然言語処理

自然言語はヒトのコミュニケーションに利用される記号である。その記号は書き手・話し手(言語生産者)によって生産され、読み手・聞き手(言語受容者)によって受容される。従来の自然言語処理においては、自然言語を運用するヒト(生産者・受容者)の介在について明確に意識せずに記号処理を行う傾向がある。そこで、記号としてのテキスト・音声を扱うだけでなく、生産者と受容者の観点を導入することを考える。本講演では、後者の受容者側の観点に基づいた研究について紹介する。具体的には、クラウドソーシングなどで収集した単語親密度や語義の類似度に関する大規模語彙データと、受容者の眼球運動計測に基づく読み時間データのデータ仕様について紹介する。このようなデータを扱うにあたって調査協力者間のゆれを統制する必要がある。その統制のために必要な一般化線形混合モデルとそのベイズ化について概説する。

講師:浅原 正幸

人間文化研究機構 国立国語研究所 コーパス開発センター 教授

【略歴】1998年京都大学総合人間学部卒業。2003年奈良先端科学技術大学院大学情報科学研究科博士後期課程修了。2004年より同大学助手→助教。2012年より人間文化研究機構国立国語研究所コーパス開発センター特任准教授→准教授。2019年より同教授。博士(工学)。言語処理学会、日本言語学会、日本語学会各会員。

セッション3[13:00-13:50]

知識駆動型言語処理─深層学習による進展とともに─

計算機による言語理解を実現するには、人間がもっているような常識的知識を計算機に与え、適切に利活用することが必要である。従来は、そのような常識的知識が計算機に欠けていたことが、言語理解の大きなボトルネックとなっていた。しかし、近年、ウェブを中心として、超大規模のテキスト集合が手に入るようになり、そこから知識を自動的に獲得できるようになったことにより、この状況が変わりつつある。また、ここ数年の深層学習の発展によりさまざまな言語処理技術の性能が急速に向上している。本発表では、これらの研究を紹介するとともに、知識に基づく言語処理・理解の現在そして未来について議論する。

講師:河原 大輔

京都大学 大学院情報学研究科 准教授

【略歴】1999年京都大学大学院工学研究科修士課程修了。2002年同大学院博士課程単位取得認定退学。東京大学大学院情報理工学系研究科学術研究支援員、独立行政法人情報通信研究機構研究員、同主任研究員を経て、2010年より京都大学大学院情報学研究科准教授。自然言語処理、知識処理の研究に従事。博士(情報学)。

セッション4[13:50-14:40]

深層学習による自然言語処理の解釈性/説明性

自然言語処理の研究分野においても深層ニューラルネットワーク(DNN)を積極的に導入し改良することで、多くの革新的な研究成果をもたらしている。その一方で、複雑なネットワーク構造を用いると、どのような理論的背景または決定過程によって結果が導出されたのかを開発者やユーザが知ることは非常に困難となる。しかし、AIに対する昨今の社会的要請の一つとして「説明可能なAI」があるように、DNNの挙動を人間が正しく把握できることが今後必要不可欠な要素技術になると考えられる。自然言語処理分野においては、一般ユーザの目に直接触れるという観点からも、特に文生成を伴うシステム(例:翻訳、対話システム)において、システムの生成文の納得できる根拠を示す技術が求められる。本講演では、文章の生成を伴うタスクで広く用いられる符号化復号化器(Encoder-decoderモデル)に焦点をあて、この技術により生成された文章の選択理由をモデル自らが説明することが可能か、という研究課題に関して、最近の成果とその展望を述べる。

講師:鈴木 潤

東北大学 大学院情報科学研究科 准教授

【略歴】2001年慶應義塾大学大学院理工学研究科修士課程修了。2001-2018年日本電信電話株式会社コミュニケーション科学基礎研究所にて自然言語処理、機械学習、人工知能関連の研究に従事(主任研究員(特別研究員))。2005年奈良先端科学技術大学院大学情報科学研究科博士後期課程修了、博士(工学)。2008–2009年MIT CSAIL客員研究員。2011-2017年慶應義塾大学理工学部非常勤講師を兼務(前期のみ)。2018年より、東北大学大学院情報科学研究科に所属。現在、NTTコミュニケーション科学基礎研究所リサーチプロフェッサー、理化学研究所革新知能統合研究センター客員研究員を兼務。

セッション5[14:50-15:40]

自然言語処理の問題を見つける・作る

本講演では、自然言語処理のための言語資源を構築する研究をいくつか紹介し、その意義と問題点について議論する。自然言語処理の研究を進めるにあたってコーパスや辞書などの言語資源は必要不可欠であり、古くから多くの言語資源が開発されてきた。近年は機械学習を用いた自然言語処理が中心であり、大規模な学習・評価データが必要とされているため言語資源の重要性が増している。ひとたび言語資源が構築されると、分析や実験はその資源を用いて行うことになる。したがって、言語資源を構築することは自然言語処理の問題を定義することに直結するため、その影響や限界を十分に考える必要がある。

講師:宮尾 祐介

東京大学 大学院情報理工学系研究科 教授

【略歴】2000年東京大学大学院理学系研究科修士課程修了。2001年より同大学にて助手、2007年より助教。2006年同大学院にて博士号(情報理工学)取得。2010年より国立情報学研究所准教授、2018年より東京大学教授。構文解析、意味解析などの自然言語処理基盤技術とその応用の研究に従事。人工知能学会、情報処理学会、言語処理学会、Association for Computational Linguistics各会員。2010年にMicrosoft Research New Faculty Award, 2012年に文部科学大臣表彰若手科学者賞、2014年に情報処理学会長尾真記念特別賞、2015年に日本学術振興会賞を受賞。

セッション6[15:50-17:00]

パネル討論