第250回NL研究発表会

第250回自然言語処理研究発表会

この度の新型コロナウイルス感染症の情勢を鑑み，本研究発表会は現地開催を中止し，オンライン開催となりました．

参加を希望される方は，情報処理学会マイページから参加申込をお願いいたします（当日でも申込可能です）．非会員の方もマイページを開設してお申し込みください．参加申込をしていただくと，ミーティング会場のURL情報や研究報告のダウンロード方法を記載したメールをお送りします．参加費無料の研究会登録会員/ジュニア会員も，URLの取得と参加者数の把握のため，マイページより参加申込をしてくださいますようお願いいたします．

オンライン参加時の注意事項については，下記リンクの資料が参考になるかと思います
（資料はFIT2020の時のものですが，本研究会もこの方針に準じて進行します）．
事前にご一読ください．

参考資料：FITオンライン参加について

参加申込

日時・会場：

日時：2021年9月28日（火）

開催方法：オンライン開催

※参加申込をしていただいた方に，研究会当日までにオンラインURLと資料ダウンロードについてをメールでお送りします．

参加費：

参加費（研究報告／税込）
参加種別	金額
NL研究会登録会員／ジュニア会員	0円
情報処理学会名誉会員、正会員、賛助会員	1,500円
情報処理学会学生会員	500円
非会員(一般)	2,500円
非会員(学生)	2,500円

申込方法　：

以下アイコンのいずれかよりお申込みください。

※非会員の方もマイページ開設が必要です。開設には費用はかかりません。
非会員の方で既にマイページを開設済みの方は、そちらのIDでお申込み可能です。
※NL研究会登録会員の費用で参加される場合で、NL研究会にまだ登録されていない方は

マイページより研究会登録をしてから研究発表会参加のお申込みを行ってください。
参考：研究会に登録する

＊＊お申込みの際の注意事項＊＊

参加申込にてご提供頂いた個人情報は、情報処理学会プライバシーポリシーに則って適切に管理します。なお、研究会幹事より直接ご連絡させていただく場合もございますのでご了承願います。参考）情報処理学会プライバシーポリシー
参加費のお支払いはマイページより原則10月15日までにお願いいたします。請求書・見積書・納品書・領収書もマイページよりダウンロード可能です。参考）マイページの利用方法：お支払い
参加申込後は申込キャンセルは出来ませんのでご注意ください。
当会の会員へ入会申込を頂いた場合も10月15日までに入会手続きが（入金まで）完了してない場合は、講演参加費を非会員価格に変更し改めて請求します事をご了承下さい。
期日後に入会（入金）された場合も変更となった参加費の金額を戻せませんのでご注意くださいますようお願いします。

研究報告について：
参加申込をしていただいた方にお送りするメールに、研究報告をダウンロードするための
ID・パスワード等を記載しております。
研究会登録会員の方は電子図書館(情報学広場) からもダウンロード可能です。
研究報告は開催初日の1週間前（＝公知日）の公開となります。

領収書について：
領収書は入金後にマイページよりダウンロード出来ます。領収書は1回しか発行できません
ので、日付、宛名、但し書きをよく確認してから発行してください。クレジットカード決済
の場合は即時発行が可能ですが、それ以外は入金済になるまで2～14営業日程かかります。
参考）マイページの利用方法：お支払い／マイページに関するよくある質問

照会先：
〒101-0062　東京都千代田区神田駿河台1-5　化学会館4F

一般社団法人情報処理学会調査研究研究部門 E-mail：sig"at"ipsj.or.jp

プログラム

●日程: 2021年9月28日(火) 9:55-16:00 (1日のみの開催に変更しました)

●会場: オンライン(Zoom)

●参加申し込み:　※9/20頃開始予定です。

参加を希望される方は情報処理学会マイページの「会員メニュー」->「イベント一覧・申込」より参加申込をお願いいたします（当日でも申込可能）．

非会員の方もマイページを開設してお申し込みください．

参加申込をしていただくと，会場のURL情報や研究報告のダウンロード方法を記載したメールをお送りします．

参加費無料の研究会登録会員/ジュニア会員も，URLの取得と参加者数の把握のため，マイページより参加申込をしてくださいますようお願いいたします．

学会サイトの「イベントに参加申込される方へ」もご参照ください．

https://www.ipsj.or.jp/member/event_moshikomi.html

●参加費:

NL研究会登録者：無料

情報処理学会ジュニア会員：無料

情報処理学会正会員、賛助会員、名誉会員：1,500円

情報処理学会学生会員：500円

情報処理学会非会員（一般）：2,500円

情報処理学会非会員（学生）：2,500円

●問い合わせ先:

横野光(明星大学) hikaru.yokono -at- meisei-u.ac.jp

===================================

プログラム

* ◎は若手奨励賞対象，○は発表者

9月28日(火)

[9:55-10:00] オープニング

[10:00-11:30] 言語分析・評価

[11:30-13:00] 昼休み

[13:00-14:30] 言語モデル

[14:45-15:45] 生成

[15:45-16:00] クロージング

9月28日(火)

[10:00-11:30] 言語分析・評価

(1) 日本語、英語、韓国語の歌に見られる比喩表現の特徴

戸部夏乃, ○西口純代(小樽商科大学)

Apple Musicでトレンドになっている曲を中心に聴いて、比喩表現を見つけられた曲の中から日本語、韓国語、英語各50曲を抜粋し、歌詞の中の比喩表現をいくつかまとめた。比喩表現の分け方として、直喩、隠喩、擬人法、また知識を要するものの４つに分けた。日本語においては、（～みたい、～のようだ）韓国語は（마치~같아, 처럼）英語では、（~like）といった表現がついているものを直喩として判断した。また知識においては、“life is a journey”のようなformula(方式)を含んでいる。3言語を通じて隠喩が一番多いが、韓国語と日本語のそれぞれの割合は大体同じになっている。英語においては2言語より、隠喩の割合が高く、擬人法と直喩の割合が少ない。日本語では英語韓国語と異なり、君、僕といった（人）を比喩する言葉が少ない。韓国語では春夏秋冬、天気、朝、夜、身体、過去、現在、未来、時間といった多くの人が理解できるであろう共通の単語が比喩表現として多く出てきているように思われる。

(2) 精神疾患の診断補助のための自伝的記憶の詳細度による分類

◎○大柳慶悟, 武田浩一, 笹野遼平(名古屋大学), ハルフォードデイビッド(ディーキン大学), 高野慶輔(ルートヴィヒ・マクシミリアン大学ミュンヘン)

自伝的記憶 (Autobiographical Memory) とは，過去に自身が体験したことについての記述である．自伝的記憶の分析は，アイデンティティ形成支援，コミュニケーションの補助からブランド構築などさまざまな分野で利用されている．特に抑うつ等の精神疾患がある人はこれを詳細に記述することが難しいことが知られており，このような特徴から Autobiographical Memory Test (AMT) を行うことで自伝的記憶を記述させ，詳細度によって分類することで精神疾患の診断の補助とすることができる．本研究は診断の補助・自伝的記憶の分析に利用することを目的とし，この自伝的記憶を詳細度によって自動的に分類する．10000件の自伝的記憶の記述を用いた実験を通して，BERT等の言語モデルを用いることで先行研究を大きく上回る分類精度を達成できることを示す．また，モデルの出力から判断が難しい記述の特徴を調査し，自伝的記憶の詳細度の望ましい分類基準について考察する．%詳細度のより明確な定義について考察する．

(3) 抽出型複数文書要約における文順序を考慮した評価

◎○藤田正悟, 上垣外英剛, 船越孝太郎, 奥村学(東京工業大学)

抽出型要約は元の文書において重要度が高い文を抽出し要約として再構成する手法であり広く使われている．その一方，この方法では複数文書を横断して重要文を抽出し要約を構成する際に，抽出された文の順序が適切ではない場合がある．解決策として既存の文並び替えモデルを使って文並び替えを行うことが考えられるが，抽出型要約に適した文並び替えの教師データが存在せず，尚且つ抽出型要約において並び替えを考慮した評価尺度が存在しないという問題がある．そこで我々は抽出型要約に適した文並び替えの教師データの作成手法と抽出型要約を並び替える場合の評価指標を提案する．いくつかのベースラインと比較した結果，我々の評価指標は特に一貫性において人手評価と高い相関を示した．

[11:30-13:00] 昼休み

[13:00-14:30] 言語モデル

(4) 複数のBERTモデルを利用したData Augmentation

◎○高萩恭介, 新納浩幸(茨城大学)

自然言語処理の分野における簡易なData Augmentationの手法として，文中の単語をその類義語に置き換えるというものがある．しかし，BERTのような事前学習済みモデルを利用する場合にこの手法を用いても，効果が期待できない．なぜなら，類義語の知識がBERTに既に組み込まれていると考えられるからである．ここでは，タスク処理に利用するBERTとは異なるBERTのMasked Language Modelを利用して類義語を得ることを提案する．この場合，タスク処理用のBERTに組み込まれていない類義語の知識を利用できるために，Data Augmentationの効果が期待できる．実験では，livedoorニュースコーパスを利用した文書分類タスクに対して，提案手法によるData Augmentationを試み，その有効性を示した．

(5) ハンドメイド作品を扱うECサイトに特化したBERTを用いた言語モデル構築に向けた取り組み

◎○酒井敏彦(GMO ペパボ株式会社/九州大学), 三宅悠介, 栗林健太郎(GMO ペパボ株式会社)

自然言語処理の技術は，ECサイトで扱うテキストデータを対象とする，質問応答や商品の分類などのタスクに活用されている．ハンドメイド作品を扱うECサイトにおける自然言語処理の課題は(1) 人手でタスクを解くのは困難，(2) ハンドメイド作品を扱うECサイトの作品が多様， (3) ハンドメイド作品を扱うECサイトの構造的な変化への追従が困難，の3つが挙げられる．本研究では，各課題に対して(1)機械的にタスクを解くことができる，(2)扱う作品が多様であっても作品の特徴を捉えられる，(3)汎用的なモデルからfine-tuningすることで構造的な変化へ追従可能，という理由からBERT+fine-tuningのモデルに着眼した．本報告では，ハンドメイド作品を扱うECサイトの課題を含むタスクのうち，商品分類のタスクにおいて，比較評価を行った．ベースライン手法は従来から一般的に用いられるTF-IDFと分類器を用いた．結果として，上記の課題を解決し，BERT+fine-tuningのモデルがF1-scoreで良い分類性能であることを示した．今後は他のタスクへの応用を検討していく．

(6) Masked Language Modelを用いたReplaced Token Detection型事前学習の汎化性の改善検討

○麻岡正洋, 酒井靖文, 笠置明彦, 田原司睦(富士通株式会社)

小規模 Masked Language Model (MLM) のGeneratorによる入力の類似文生成と、Generatorが書き換えた場所を推定（Replaced Token Detection, RTD）するDiscriminatorを組み合わせたELECTRAが提案されており、BERTなどの既存手法に比べて同程度の精度を高速に学習できることが報告されている。しかし、我々は日本語ベンチマークにおいてELECTRAの精度が頭打ちになるという事象を観測した。この原因として、RTDが入力を書き換えたか書き換えていないかの2択問題という簡単な問題を解いており、汎化性が低くなるからではないかという仮説を立てた。そこで、我々は回答候補の多いMLMをRTD学習に混ぜることで汎化性を高くすることを試みた。具体的にはGeneratorが書き換えた文に再度マスクをして、Discriminatorにマスクをした箇所はMLMとして、マスクをしていない箇所はRTDとして学習する方法を提案する。この方法によって、RTDの事前学習モデルの精度を向上できるかどうかを検証した。

[14:45-15:45] 生成

(7) 主題性にもとづく雑談対話システムの構築

◎○吉越卓見, 児玉貴志(京都大学), 坂田亘(LINE株式会社), 田中リベカ(お茶の水女子大学), 黒橋禎夫, 新隼人(京都大学)

人間の対話は、文脈中に出現した語句のうち、その場において最も意識の向いた話題に沿って展開される。本研究では、各語句に向けられる意識の度合いを主題性と呼ぶ。既存の雑談対話システムは、文脈は考慮するが、話題は意識することなく応答を生成する。そのため、話題に沿わない応答をしてしまうことが少なくない。本研究では、主題性の最も高い語句にもとづいて応答を生成することで雑談対話システムが話題に沿った自然な応答をすることを目的とする。この対話システムは、文脈中の主題性の最も大きい語句を推定する主題性推定モジュールと、与えられた語句にもとづいて応答を生成する応答生成モジュールからなる。主題性推定モジュールは、対話データにもとづいた自己教師あり学習により各語句の主題性を定量化し、主題性の最も高い語句を選択する。応答生成モジュールは、与えられた語句が応答に含まれるように生成モデルを学習することで実現する。人手評価により、主題性を考慮した対話システムは、主題性を考慮しないときより自然な応答をすることが確認された。

(8) レーシングゲーム実況生成

○石垣達也, トピチゴラン(産業技術総合研究所),濵園侑美(産業技術総合研究所/お茶の水女子大学), 能地宏(産業技術総合研究所/LeapMind), 小林一郎(産業技術総合研究所/お茶の水女子大学), 宮尾祐介(産業技術総合研究所/東京大学), 高村大也(産業技術総合研究所)

本稿では、新たな言語生成タスクとして、レーシングゲーム実況テキスト生成を提案する。このタスクでは、視覚情報としてレーシングゲームの録画映像、言語データとして実況発話、構造化データとして速度、ハンドル角度といった数値データを入力として扱い、視聴者が映像を視聴しながら、レースをより理解し、楽しむための実況テキストを生成する。既存の言語生成研究においては、データセットの欠如が一因となり映像、言語、構造化データといった複数モダリティを同時に考慮する研究が存在しない。実況生成では特に「どのタイミングで発話するか」「何を発話するか」を最低限決定する必要があるが、例えば野球を対象とした既存研究においてはイニングの間に実況を行うなど、発話タイミングがあらかじめ与えられる設定を扱っている。このような背景から、本研究ではまず、映像、構造化データとそれらに対応する実況テキストが対になった大規模データセットを作成し、レース実況の特徴について分析する。分析より、実況テキストの時間および実況者の観る映像の視点の影響を受け、その言語的な特徴が変化することが分かった。次に、実況生成タスクをタイミング同定と発話生成の2つの部分問題に分割しいくつかのモデルを性能評価した。実験より、構造化データの活用は有益である一方、既存の画像分類タスク等で性能が良いとされる画像エンコーダを用いたとしても、本タスクにおいては視覚情報の効果が限定的であり、実況生成タスクが挑戦的な課題であることが分かった。マルチモーダルな言語生成タスクのためのデータセットとして、本研究で作成したデータセットは公開する。

[15:45-16:00] クロージング

===================================

★研究会幹事団

主査：

　関根聡　　　　理化学研究所

幹事：

　内海慶　　　　株式会社デンソーアイティーラボラトリ

　内田ゆず　　　北海学園大学

　木村泰知　　　小樽商科大学

　古宮嘉那子　　東京農工大学

　笹野遼平　　　名古屋大学

　須藤克仁　　　奈良先端科学技術大学院大学

　横野光　　　　明星大学

　吉野幸一郎　　理化学研究所

運営委員：

　石垣達也　　　産業技術総合研究所

　江原遥　　　　東京学芸大学

　大内啓樹　　　奈良先端科学技術大学院大学

　亀甲博貴　　　京都大学

　小林暁雄　　　農業・食品産業技術総合研究機構

　斉藤いつみ　　日本電信電話株式会社

　佐々木稔　　　茨城大学

　渋木英潔　　　株式会社BESNA研究所

　田中リベカ　　お茶の水女子大学

　田村晃裕　　　同志社大学

　成松宏美　　　日本電信電話株式会社

　西田京介　　　日本電信電話株式会社

　羽鳥潤　　　　株式会社 Preferred Networks

　増村亮　　　　日本電信電話株式会社

　松林優一郎　　東北大学

　馬緤美穂　　　ヤフー株式会社

　水本智也　　　フューチャー株式会社

　三輪誠　　　　豊田工業大学

　森田一　　　　富士通株式会社

　谷中瞳　　　　東京大学

　吉川克正　　　東京海上ホールディングス株式会社

　吉永直樹　　　東京大学生産技術研究所

　鷲尾光樹　　　東京大学

発表募集のご案内

★★★★★★★★★★★★★★★　原稿締切厳守！　★★★★★★★★★★★★★★★★
・原稿締切日の24時を過ぎるとシステムに投稿が出来なくなり、
発表も取り消しとなりますのでご注意ください。
・原稿締切までは何度でもご自身でアップロード可能です。
（締切後は、原稿の差替え（再アップロード）、発表の取り消しもできませんのでご注意ください。）
・フォントが正しく埋め込まれていないといったトラブルもありますので、
早めに一度アップロードされることをお勧めします。
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★

情報処理学会第250回自然言語処理研究会発表募集

https://nl-ipsj.or.jp

●日程: 2021年9月27日(月)，9月28日(火)

●会場: オンライン (ビデオ会議システムとしてZoomを利用予定)

※オンライン発表でも大勢の聴講者から有益なコメントが得られます．

皆様の投稿をおまちしています．

●発表申込締切: 2021年8月27日(金)

●原稿締切: 2021年9月3日(金) ※厳守

●原稿ページ数:2ページ以上

電子化にともないページ数に上限はありません．

※ ただし20ページを越える場合は事前にご連絡ください．

●発表時間予定: 一般講演形式 1件30分 (発表20分、質疑10分)

※ 発表時間の調整について

従来の一般講演形式(発表20分，質疑10分)に加えてショート形式(発表10分，

質疑10分)，討議形式(発表10分，質疑討論20分)など，発表者からの要望に

応じて発表の合計時間を調整します．

アイデアレベルの研究の紹介や，研究の詳細まで話したいので時間がほしい，

などの要求を発表申込の備考欄にご記入いただければ，それらを考慮して

プログラムを作成します．ぜひご活用ください．

●優秀研究賞

研究会に投稿された予稿の中から特に優れたものを優秀研究賞として表彰

する予定です．

●若手奨励賞

年度開始時点（4月1日）で30歳未満，あるいは学生（社会人博士含む）の方を

対象として，研究会参加者の投票によって選考します．

●発表申込先: 下記専用サイトよりお申込みください．

https://ipsj1.i-product.biz/ipsjsig/NL/

（研究会ホームページからもアクセスできます）

●問い合わせ先:

内海慶(デンソーアイティーラボラトリ)

E-mail: uchiumi.kei (at) core.d-itlab.co.jp

●今後の予定

第251回研究会 2021年12月頃予定

★研究報告のペーパーレス化

本研究会はペーパーレスでの開催となり，印刷した研究報告の配布を行い

ません．また，特許出願の公知日（研究報告の公開日）が従来より1週間

早まりますので，ご留意ください．

※自然言語処理研究会に登録されている方

研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開

します．当日は資料をプリントアウトしてご持参いただくか，ご自身の

PCにダウンロードのうえ，ご持参ください．

情報処理学会電子図書館（情報学広場）

https://ipsj.ixsq.nii.ac.jp/ej/　（ユーザ登録が必要です）

当日閲覧用サイト

http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方

当日閲覧用サイトにアクセスできるようにいたします．

なお，当研究会にご登録頂くことで，

本研究会の資料をバックナンバーも含めて電子図書館で購読できます．

登録されていない方は，是非この機会に研究会に登録してください

（登録まで最大3日かかりますのでご留意ください）．

★研究会への登録をお勧めします

年に２回以上の参加を見込まれる方は，研究会に登録される方が（ほぼ）

お得になります．研究会登録は以下のウェブサイトから行えます．

http://www.ipsj.or.jp/kenkyukai/toroku.html

★受け付けは先着順で行なっております

多数のお申し込みを頂いた場合，次回の研究会にまわって頂くよう

お願いする場合があります．なるべく早めにお申し込み下さい．

★締め切り後の発表キャンセルは原則としてできません

発表申し込み後にキャンセルの必要が生じた場合は，至急ご連絡ください．

発表申込後，原稿提出締め切りまでに原稿が到着しない場合には，幹事団の

判断により発表を取り消しさせていただくこともあります．

★論文提出締切後の原稿差し替えはできません

論文提出締切後は，訂正版のアップロードやウェブ上での配布などの原稿

差し替えは一切できませんので，予めご留意ください．

※正誤表の掲載が可能な場合がありますのでご相談ください．