No.06

言語と知識 ―最新言語処理研究の射程―

3月9日 15:30-18:00

共同企画:言語処理学会

会場:第1イベント会場

講演者 Speaker

パネル司会

写真鳥澤 健太郎
情報通信研究機構 MASTARプロジェクト,言語基盤グループ グループリーダー

講演

写真長尾 真
国立国会図書館 館長

写真橋田 浩一
産業技術総合研究所 社会知能技術研究ラボ長

写真中村 哲
情報通信研究機構 知識創成コミュニケーション研究センター 副研究センター長

概要 Abstract

知識の表現と伝達のための最も一般的な手段である言語が果たすべき役割は知識社会においてますます重要性を増している.そして,近年の言語処理技術は,そのような言語の機能を増幅することによって社会における知識循環を高度化することを射程に入れつつある.本セッションでは,そのような言語処理に関する研究プロジェクトに関するプロジェクトリーダーらによる講演を通じて,変貌著しい言語処理研究の最前線とそれによって予見される社会的インパクトについて紹介し,言語への工学的アプローチに関する理解を深めてもらうことを狙う.

プログラム Program

15:30~15:35 本イベントについて

鳥澤 健太郎

本イベントの趣旨説明

15:35~16:30 講演(1):これからの言語処理とその応用

長尾 真

今日インターネット上には会話文,論説文,小説文など種々のスタイルの文章がぼう大に存在している.またテキストと他言語への翻訳文の対などもある.これらのテキストを何十億文と収集しデータベース化すれば,これは言語のあらゆる可能な表現の集りとみなすことができよう.言語の総体がこのように客観的な形で把握できれば,言語研究は自然科学的手法で行うことが出来ることになる.そういった立場からスーパーコンピュータの力を借りて言語処理が行われ,多くの優れた成果が出て来ている.これらは機械翻訳,情報検索,情報信頼性,電子図書館などの研究開発に大きく貢献するようになっている.またこれら大量のテキストデータから知識を抽出し,これを組織化し言語処理過程に組み込むことによって,言語処理の精度が向上し,また種々の言語処理の応用分野のシステムの性能の向上につながるという好循環が実現している.これまでの半世紀の言語処理研究の努力がようやく実を結び,社会に具体的な形で貢献する時代に入って来た.

16:30~17:15 講演(2):総合学術オントロジー

橋田 浩一

ますます困難になりつつある社会的課題を解決するためには,従来を上回る規模での科学的知識の体系化とその社会的共有が必須と思われる.それには,研究領域のタコツボ化を防ぎ領域間の融合を進めつつ,科学研究と実社会とを融合する必要があるだろう.その意味での「科学的根拠に基づく社会 evidence-based society」の構築に資するため,情報処理学会の「次世代情報処理ハンドブック」および日本認知科学会の「認知科学オントロジー」を中核として,多数の学会の共同作業により,学術的な概念をオントロジーに基づいて構造化・体系化して「総合学術オントロジー」を編纂し,これによって研究分野の間および研究コミュニティと一般社会との間の相互作用を活性化する計画を進めている.

17:15~18:00 講演(3):MASTARプロジェクト&ALAGINフォーラム

中村 哲

大量のコーパスと統計モデル,機械学習による音声言語処理手法の到来は,研究開発フェーズから実際の場面での性能向上を産業界,社会とリンクした形で持続的に直接行える,新しい研究開発プロセスの到来と考えることが出来る.さらに,Webの仕組み,Web上の情報を利用することで,世の中にある固有名詞の取り込み,多言語辞書の構築やコーパス収集,単語の関係抽出などの解析を行うことも可能になる.当機構では,Web,ネットワークを利用し,持続的に研究開発を進めるMASTARプロジェクトを2008年4月から開始した.具体的には,ネットワーク型の音声翻訳,機械翻訳,音声対話システム,言語資源の研究開発を進めている.また,2009年3月には,当プロジェクトの成果だけでなく,産学官が成果を持ち寄り,成果を融合し,新たな展開を促進する高度言語情報融合(ALAGIN)フォーラムが設立された.これらの活動の現状と狙いについて紹介する.

講演者略歴 Biography

鳥澤 健太郎
1992年東京大学理学部情報科学科卒.1995年東京大学大学院理学系研究科情報科学専攻中退.同年同専攻助手.その後,科学技術振興事業団さきがけ研究21研究員(兼任),北陸先端科学技術大学院大学助教授,同准教授を経て,2008年より情報通信研究機構MASTARプロジェクト言語基盤グループ  グループリーダー,現在に至る.一貫して自然言語処理の研究に従事.

長尾 真
1936年生まれ 工学博士
専門は,自然言語処理,画像処理,パターン認識,電子図書館.
京都大学工学部電子工学科卒業,京都大学総長(第23代),独立行政法人情報通信研究機構理事長を経て,2007年4月から国立国会図書館長.
機械翻訳国際連盟会長(初代),言語処理学会会長(初代),電子情報通信学会会長,情報処理学会会長,日本図書館協会会長なども歴任.

橋田 浩一
1981年東京大学理学部情報科学科卒業.1986年同大学院理学系研究科博士課程修了.理学博士.電子技術総合研究所,(財)新世代コンピュータ技術開発機構を経て産業技術総合研究所に勤務.日本認知科学会会長,言語処理学会副会長.専門は自然言語処理,知識工学,認知科学.

中村 哲
1981年京都工芸繊維大学電子工学科卒.博士(工学)京都大学.シャープ研究所,ATR自動翻訳電話研究所,奈良先端大情報科学研究科助教授,ATR音声言語コミュニケーション研究所所長を経て,2006年より(独)情報通信研究機構MASTARプロジェクトリーダ,2009年8月より知識創成コミュニケーション研究センター副センター長,現在に至る.音声言語処理の研究に従事.ATRフェロー.ドイツ・カールスルーエ大学客員教授.