自然言語処理研究会は,2002~2007年頃をピークに,長期的に登録者数,発表件数が減少傾向にある.これは,近年の人工知能ブームに対し,反対の傾向にあるようにも受け止められるが,以下のような要因が考えられる.1つには人工知能ブームによって,優秀な学生が修士課程を出ると米国資本や日本の大企業またはベンチャー企業などに引く手あまたな状況で就職し,アカデミアの層が薄くなっていることである.博士課程の学生確保の難しさは多くの大学教授の共通の悩みであり,根本的な問題解決はできていない.そのため,主に博士課程の学生が発表する場である自然言語処理研究会の発表件数の減少が生じていると考えられる.また,アーカイブの出現など新しい形の論文発表の機会が出現し,それによって既存の形式の研究会は相対的な地盤沈下を起こしていることが挙げられる.また,自然言語処理を対象とするさまざまな研究会や学会の会議などが作られており,そういった会議との住み分けがまだきちんとできていないことも課題となっているであろう.そのような状況において,中堅の研究者によるシンポジウムの開催,質疑応答時間の充実による特徴付け,優秀賞,若手奨励賞などの授与による発表の動機付けなどの施策を行ってきた.特に「自然言語処理の中長期研究構想を語る会」は2回の開催とも多数の参加者を得て非常に好評であった.
ここ10年間での自然言語処理研究分野は,1990年初頭から始まった大規模なデータに基づいた経験的な技術の枠組みが成熟し,機械学習の手法として決定木,MAXEnt,CRF,SVMと発展してきたものが,深層学習という新しいパラダイムが登場し,その手法により,さまざまな基盤技術や応用において驚異的な発展が見られたということでまとめられる.特に,この状況を端的に説明し,現在の自然言語処理の研究の問題点を浮き彫りにさせる2つの大きなエポックを紹介する.
博学知識を問う米国のテレビ番組「Jeopardy!」というクイズ番組がある.この番組の歴代最強といわれる人間のチャンピオンを,2011年にIBMが開発した質問応答システムが圧倒的な差で破った.たとえば「最大の空港は第二次世界大戦の英雄の名前からとり,2番目に大きな空港は第二次世界大戦の戦場の名前からとった米国の都市はどこでしょう?」という質問に一瞬で「シカゴ」と答えることを期待されているようなクイズ番組である.開発は人間には到底及ばないレベルと思われていたが,最後には圧倒的な差で勝利するという結果になり,チェスに次いで,知識のタスクでも人間の能力を超えたと驚きをもって受け止められた.しかしながら,このシステムの仕組みは以下のとおりである.まず,開発者らはこのクイズの答えのほとんどはWikipediaの項目名であるということを突き止めた.したがって,数百万のWikipedia項目名から最も回答らしいと思われる項目を選ぶという問題に定式化された.そして,過去の質問と答えのペアを基に,数多くのサブシステムを組合せ,機械学習によって最適な重みを学習し,もっともらしいWikipediaの項目名を選ぶという仕組みである.つまり,質問に対して人間のような理解をし,そのうえで答えを導出しているわけではない.また,人間のように答えの導出の根拠を人間が理解可能な形で説明をすることもできない.
この質問応答と呼ばれる技術や関連した文章読解では,新装学習による技術革新が続いており,2011年よりもはるかに高い精度を達成している.しかしながら答えの導出の説明ができないという問題は解決されていない.
機械翻訳サービスはWeb上で無償で提供されるようになってきているが,2016年11月にグーグルがその提供サービスの技術を,それまでのフレーズベースの統計的機械翻訳から,深層学習による機械翻訳に変えた.その結果,翻訳精度の向上は専門家だけではなく広く一般の人も驚くほどであった.グーグルが持つ大規模な対訳データと大規模な計算パワーが必要ではあるが,特徴量の指定も必要がない深層学習の枠組みが,それまで成功していた画像認識のような比較的シンプルな枠組みのタスクのみではなく,構造を持っていると思われていた自然言語処理の応用タスクに対して,構造を扱うことの不要性を提示した点が非常に大きなインパクトを持って受け止められた.まだ,色々な面で問題点はあり,教師なしでの対訳例の学習などさまざまな試みが行われている.しかし,自然言語処理の代表的な応用である機械翻訳が,特定の条件下で特定の目的ではあるが,非常に高いレベルで実現されたという事実は重要である.
質問応答,機械翻訳だけではなく,自然言語処理のあらゆる基礎技術や応用において深層学習の技術が試されている.多くの場面で飛躍的な精度の向上が見られ,最近の国際学会などでは,深層学習ではない技術を使った論文が見当たらないほどである.それぞれの技術の精度向上は喜ばしいことであり,それぞれの技術に対応した深層学習の応用に工夫を施し,最適な使い方を見出すことは必要な技術開発であり,今後も続いていくとは考えられるが,研究対象である「言語」についての研究がおざなりにされてしまっている感は否めない.
過去の機械学習のそれぞれの技術の研究がそうであったように,深層学習の研究もどこかの段階で限界を迎えるであろう.現在,多くの研究者が感じている限界は,深層学習はブラックボックスであり,実際に中で何が起こっているか分からないことである.つまり,2章でも述べたように,システムの出力が導かれた説明ができないことである.自然言語処理システムが100%の精度であれば問題はないが,まだ間違うことがある場合には,この問題は致命的である.出された答えが正解であるかどうかをユーザである人間は知る術がないわけである.この点は,言語の意味理解にも関連して非常に難しい問題ではあるが,深層学習の最適化研究が一段落したときに,自然言語処理研究者が真剣に取り組むべき課題であり,それに向けた研究は始まっている.システムが説明をするためには,何らかの世界知識や常識が必要なこと,文の単位を超えた関係性の把握,常識を利用し,状況によった推論などがそのための重要な技術となろう.そのような人間の言語処理を見据えた技術に対して,深層学習などのインプリメンテーションの技術が合間って新しい境地が切り開かれると展望している.
目次に戻る
All Rights Reserved, Copyright (C) Information Processing Society of Japan