●日程: 2021年9月28日(火) 9:55-16:00 (1日のみの開催に変更しました)
●会場: オンライン(Zoom)
●参加申し込み: ※9/20頃開始予定です。
参加を希望される方は情報処理学会マイページの「会員メニュー」->「イベント一覧・申込」より参加申込をお願いいたします(当日でも申込可能).
非会員の方もマイページを開設してお申し込みください.
参加申込をしていただくと,会場のURL情報や研究報告のダウンロード方法を記載したメールをお送りします.
参加費無料の研究会登録会員/ジュニア会員も,URLの取得と参加者数の把握のため,マイページより参加申込をしてくださいますようお願いいたします.
学会サイトの「イベントに参加申込される方へ」もご参照ください.
●参加費:
NL研究会登録者:無料
情報処理学会ジュニア会員:無料
情報処理学会正会員、賛助会員、名誉会員:1,500円
情報処理学会学生会員:500円
情報処理学会非会員(一般):2,500円
情報処理学会非会員(学生):2,500円
●問い合わせ先:
横野光(明星大学) hikaru.yokono -at- meisei-u.ac.jp
===================================
プログラム
* ◎は若手奨励賞対象,○は発表者
9月28日(火)
[9:55-10:00] オープニング
[10:00-11:30] 言語分析・評価
[11:30-13:00] 昼休み
[13:00-14:30] 言語モデル
[14:45-15:45] 生成
[15:45-16:00] クロージング
9月28日(火)
[10:00-11:30] 言語分析・評価
(1) 日本語、英語、韓国語の歌に見られる比喩表現の特徴
戸部 夏乃, ○西口 純代(小樽商科大学)
Apple Musicでトレンドになっている曲を中心に聴いて、比喩表現を見つけられた曲の中から日本語、韓国語、英語各50曲を抜粋し、歌詞の中の比喩表現をいくつかまとめた。比喩表現の分け方として、直喩、隠喩、擬人法、また知識を要するものの4つに分けた。日本語においては、(~みたい、~のようだ)韓国語は(마치~같아, 처럼)英語では、(~like)といった表現がついているものを直喩として判断した。また知識においては、“life is a journey”のようなformula(方式)を含んでいる。3言語を通じて隠喩が一番多いが、韓国語と日本語のそれぞれの割合は大体同じになっている。英語においては2言語より、隠喩の割合が高く、擬人法と直喩の割合が少ない。日本語では英語韓国語と異なり、君、僕といった(人)を比喩する言葉が少ない。韓国語では春夏秋冬、天気、朝、夜、身体、過去、現在、未来、時間といった多くの人が理解できるであろう共通の単語が比喩表現として多く出てきているように思われる。
(2) 精神疾患の診断補助のための自伝的記憶の詳細度による分類
◎○大柳 慶悟, 武田 浩一, 笹野 遼平(名古屋大学), ハルフォード デイビッド(ディーキン大学), 高野 慶輔(ルートヴィヒ・マクシミリアン大学ミュンヘン)
自伝的記憶 (Autobiographical Memory) とは,過去に自身が体験したことについての記述である.自伝的記憶の分析は,アイデンティティ形成支援,コミュニケーションの補助からブランド構築などさまざまな分野で利用されている.特に抑うつ等の精神疾患がある人はこれを詳細に記述することが難しいことが知られており,このような特徴から Autobiographical Memory Test (AMT) を行うことで自伝的記憶を記述させ,詳細度によって分類することで精神疾患の診断の補助とすることができる.本研究は診断の補助・自伝的記憶の分析に利用することを目的とし,この自伝的記憶を詳細度によって自動的に分類する.10000件の自伝的記憶の記述を用いた実験を通して,BERT等の言語モデルを用いることで先行研究を大きく上回る分類精度を達成できることを示す.また,モデルの出力から判断が難しい記述の特徴を調査し,自伝的記憶の詳細度の望ましい分類基準について考察する.%詳細度のより明確な定義について考察する.
(3) 抽出型複数文書要約における文順序を考慮した評価
◎○藤田 正悟, 上垣外 英剛, 船越 孝太郎, 奥村 学(東京工業大学)
抽出型要約は元の文書において重要度が高い文を抽出し要約として再構成する手法であり広く使われている.その一方,この方法では複数文書を横断して重要文を抽出し要約を構成する際に,抽出された文の順序が適切ではない場合がある.解決策として既存の文並び替えモデルを使って文並び替えを行うことが考えられるが,抽出型要約に適した文並び替えの教師データが存在せず,尚且つ抽出型要約において並び替えを考慮した評価尺度が存在しないという問題がある.そこで我々は抽出型要約に適した文並び替えの教師データの作成手法と抽出型要約を並び替える場合の評価指標を提案する.いくつかのベースラインと比較した結果,我々の評価指標は特に一貫性において人手評価と高い相関を示した.
[11:30-13:00] 昼休み
[13:00-14:30] 言語モデル
(4) 複数のBERTモデルを利用したData Augmentation
◎○高萩 恭介, 新納 浩幸(茨城大学)
自然言語処理の分野における簡易なData Augmentationの手法として,文中の単語をその類義語に置き換えるというものがある.しかし,BERTのような事前学習済みモデルを利用する場合にこの手法を用いても,効果が期待できない.なぜなら,類義語の知識がBERTに既に組み込まれていると考えられるからである.ここでは,タスク処理に利用するBERTとは異なるBERTのMasked Language Modelを利用して類義語を得ることを提案する.この場合,タスク処理用のBERTに組み込まれていない類義語の知識を利用できるために,Data Augmentationの効果が期待できる.実験では,livedoorニュースコーパスを利用した文書分類タスクに対して,提案手法によるData Augmentationを試み,その有効性を示した.
(5) ハンドメイド作品を扱うECサイトに特化したBERTを用いた言語モデル構築に向けた取り組み
◎○酒井 敏彦(GMO ペパボ株式会社/九州大学), 三宅 悠介, 栗林 健太郎(GMO ペパボ株式会社)
自然言語処理の技術は,ECサイトで扱うテキストデータを対象とする,質問応答や商品の分類などのタスクに活用されている.ハンドメイド作品を扱うECサイトにおける自然言語処理の課題は(1) 人手でタスクを解くのは困難,(2) ハンドメイド作品を扱うECサイトの作品が多様, (3) ハンドメイド作品を扱うECサイトの構造的な変化への追従が困難,の3つが挙げられる.本研究では,各課題に対して(1)機械的にタスクを解くことができる,(2)扱う作品が多様であっても作品の特徴を捉えられる,(3)汎用的なモデルからfine-tuningすることで構造的な変化へ追従可能,という理由からBERT+fine-tuningのモデルに着眼した.本報告では,ハンドメイド作品を扱うECサイトの課題を含むタスクのうち,商品分類のタスクにおいて,比較評価を行った.ベースライン手法は従来から一般的に用いられるTF-IDFと分類器を用いた.結果として,上記の課題を解決し,BERT+fine-tuningのモデルがF1-scoreで良い分類性能であることを示した.今後は他のタスクへの応用を検討していく.
(6) Masked Language Modelを用いたReplaced Token Detection型事前学習の汎化性の改善検討
○麻岡 正洋, 酒井 靖文, 笠置 明彦, 田原 司睦(富士通株式会社)
小規模 Masked Language Model (MLM) のGeneratorによる入力の類似文生成と、Generatorが書き換えた場所を推定(Replaced Token Detection, RTD)するDiscriminatorを組み合わせたELECTRAが提案されており、BERTなどの既存手法に比べて同程度の精度を高速に学習できることが報告されている。しかし、我々は日本語ベンチマークにおいてELECTRAの精度が頭打ちになるという事象を観測した。この原因として、RTDが入力を書き換えたか書き換えていないかの2択問題という簡単な問題を解いており、汎化性が低くなるからではないかという仮説を立てた。そこで、我々は回答候補の多いMLMをRTD学習に混ぜることで汎化性を高くすることを試みた。具体的にはGeneratorが書き換えた文に再度マスクをして、Discriminatorにマスクをした箇所はMLMとして、マスクをしていない箇所はRTDとして学習する方法を提案する。この方法によって、RTDの事前学習モデルの精度を向上できるかどうかを検証した。
[14:45-15:45] 生成
(7) 主題性にもとづく雑談対話システムの構築
◎○吉越 卓見, 児玉 貴志(京都大学), 坂田 亘(LINE株式会社), 田中 リベカ(お茶の水女子大学), 黒橋 禎夫, 新 隼人(京都大学)
人間の対話は、文脈中に出現した語句のうち、その場において最も意識の向いた話題に沿って展開される。本研究では、各語句に向けられる意識の度合いを主題性と呼ぶ。既存の雑談対話システムは、文脈は考慮するが、話題は意識することなく応答を生成する。そのため、話題に沿わない応答をしてしまうことが少なくない。本研究では、主題性の最も高い語句にもとづいて応答を生成することで雑談対話システムが話題に沿った自然な応答をすることを目的とする。この対話システムは、文脈中の主題性の最も大きい語句を推定する主題性推定モジュールと、与えられた語句にもとづいて応答を生成する応答生成モジュールからなる。主題性推定モジュールは、対話データにもとづいた自己教師あり学習により各語句の主題性を定量化し、主題性の最も高い語句を選択する。応答生成モジュールは、与えられた語句が応答に含まれるように生成モデルを学習することで実現する。人手評価により、主題性を考慮した対話システムは、主題性を考慮しないときより自然な応答をすることが確認された。
(8) レーシングゲーム実況生成
○石垣 達也, トピチ ゴラン(産業技術総合研究所),濵園 侑美(産業技術総合研究所/お茶の水女子大学), 能地 宏(産業技術総合研究所/LeapMind), 小林 一郎(産業技術総合研究所/お茶の水女子大学), 宮尾 祐介(産業技術総合研究所/東京大学), 高村 大也(産業技術総合研究所)
本稿では、新たな言語生成タスクとして、レーシングゲーム実況テキスト生成を提案する。このタスクでは、視覚情報としてレーシングゲームの録画映像、言語データとして実況発話、構造化データとして速度、ハンドル角度といった数値データを入力として扱い、視聴者が映像を視聴しながら、レースをより理解し、楽しむための実況テキストを生成する。既存の言語生成研究においては、データセットの欠如が一因となり映像、言語、構造化データといった複数モダリティを同時に考慮する研究が存在しない。実況生成では特に「どのタイミングで発話するか」「何を発話するか」を最低限決定する必要があるが、例えば野球を対象とした既存研究においてはイニングの間に実況を行うなど、発話タイミングがあらかじめ与えられる設定を扱っている。このような背景から、本研究ではまず、映像、構造化データとそれらに対応する実況テキストが対になった大規模データセットを作成し、レース実況の特徴について分析する。分析より、実況テキストの時間および実況者の観る映像の視点の影響を受け、その言語的な特徴が変化することが分かった。次に、実況生成タスクをタイミング同定と発話生成の2つの部分問題に分割しいくつかのモデルを性能評価した。実験より、構造化データの活用は有益である一方、既存の画像分類タスク等で性能が良いとされる画像エンコーダを用いたとしても、本タスクにおいては視覚情報の効果が限定的であり、実況生成タスクが挑戦的な課題であることが分かった。マルチモーダルな言語生成タスクのためのデータセットとして、本研究で作成したデータセットは公開する。
[15:45-16:00] クロージング
===================================
★研究会幹事団
主査:
関根 聡 理化学研究所
幹事:
内海 慶 株式会社デンソーアイティーラボラトリ
内田 ゆず 北海学園大学
木村 泰知 小樽商科大学
古宮 嘉那子 東京農工大学
笹野 遼平 名古屋大学
須藤 克仁 奈良先端科学技術大学院大学
横野 光 明星大学
吉野 幸一郎 理化学研究所
運営委員:
石垣 達也 産業技術総合研究所
江原 遥 東京学芸大学
大内 啓樹 奈良先端科学技術大学院大学
亀甲 博貴 京都大学
小林 暁雄 農業・食品産業技術総合研究機構
斉藤 いつみ 日本電信電話株式会社
佐々木 稔 茨城大学
渋木 英潔 株式会社BESNA研究所
田中 リベカ お茶の水女子大学
田村 晃裕 同志社大学
成松 宏美 日本電信電話株式会社
西田 京介 日本電信電話株式会社
羽鳥 潤 株式会社 Preferred Networks
増村 亮 日本電信電話株式会社
松林 優一郎 東北大学
馬緤 美穂 ヤフー株式会社
水本 智也 フューチャー株式会社
三輪 誠 豊田工業大学
森田 一 富士通株式会社
谷中 瞳 東京大学
吉川 克正 東京海上ホールディングス株式会社
吉永 直樹 東京大学 生産技術研究所
鷲尾 光樹 東京大学