第236回NL研究発表会

第236回自然言語処理研究発表会

標記の研究発表会はペーパレスで行います(貸し出し用のUSBメモリもご用意しています)。
  • 研究会に登録されている方
    研究報告は開催初日の1週間前(=公知日)に電子図書館当日用サイト(登録会員用)で公開します。

  • 研究会に登録されていない方
    当日受付で資料閲覧用のアカウント情報(URL,ID,PW)をお渡しいたします。
    尚、研究会にご登録いただくことで当研究会のバックナンバーも含めて全て電子図書館でご購読いただけます。登録に関しては 研究会に登録する」のページをご参照ください。

開催案内

情報処理学会 第236回自然言語処理研究会 参加募集

https://nl-ipsj.or.jp

●日程: 2018年7月9日(月),10日(火)

●会場: 理化学研究所 革新知能統合研究センター (AIP)
コレド日本橋15階
https://aip.riken.jp/access

●意見交換会
7月9日(月) 16:20から研究会会場にて,お茶菓子等をご用意した
意見交換会の開催を予定しております.人数の把握のため,参加を
希望される方は6月29日(金)までに以下のフォームからご入力下さい.

https://goo.gl/forms/hZXt7iu5YgVr7NWf1


●動画中継
今回の研究会では,インターネットを利用した研究発表の動画中継を予定
しております.基本的にすべての発表を動画中継の対象とする予定ですが,
発表者の希望により対象から外すことも出来ますので,研究発表の当日に
その旨お伝えください.閲覧方法についてはNL研ホームページでご案内す
る予定です.

●問い合わせ先:
横野光((株)富士通研究所)
E-mail: yokono.hikaru (at) jp.fujitsu.com

==================
プログラム

7月9日(月) 10:15-16:10 (6件+招待講演1件)
[10:15-11:45] 分散表現 (3件)
[11:45-13:30] 昼休み
[13:30-14:30] 招待講演 (1件)
[14:30-14:40] 休憩
[14:40-16:10] 言語処理応用 (3件)
[16:20-17:50] 意見交換会

7月10日(火) 10:15-15:55 (7件)
[10:15-11:45] 構文解析・意味解析 (3件)
[11:45-13:30] 昼休み
[13:30-14:30] 対話 (2件)
[14:30-14:40] 休憩
[14:40-15:40] Web言語処理 (2件)
[15:40-15:55] クロージング

7月9日(月) 10:15-16:10
[10:15-11:45] 分散表現 (3件)
1. 分散表現のファインチューニングによる語義曖昧性解消の領域適応

柳沼 大輝, 古宮 嘉那子, 新納 浩幸 (茨城大)

本論文では語義曖昧性解消の領域適応の問題を扱う。質の高い分散表現を用い
ることで、語義曖昧性解消の精度が向上することが知られている。しかし質の
高い分散表現を使用した語義曖昧性解消であっても領域が変化することによる
悪影響を受ける。そこでターゲットデータのコーパスを利用して、分散表現を
ターゲットデータにファインチューニングすることで、語義曖昧性解消の領域
が変化することによる悪影響に対処する。実験では分散表現としてnwjc2vec
及び日本語 Wikipediaから構築した分散表現を用いる。ターゲットデータと
して「Yahoo! 知恵袋」「新聞」「白書」の3つから計6通りの領域適応を行う。
語義曖昧性解消は各領域に共通して出現する72単語を対象とした。実験の結果、
比較的小さなターゲットデータに対してはファインチューニングの効果が確認
できた。

2. 教師なしニューラル単語分割を用いた分散表現獲得

平岡 達也, 進藤 裕之 (NAIST)

教師なし単語分割はギブスサンプリングによる言語モデルの尤度最大化として
行う手法が提案されている[持橋,2009].また,分割の際に用いる言語モデル
をニューラル言語モデルに置き換える試みも[友利,2018]にて提案されている.
しかしニューラルネットワークを用いた手法には計算コストが高いという問題
がある.本論文ではモデルの単純化により計算コストを軽減する手法について
提案する.さらに分割によって得られた単語分散表現が,日本語の文分類タス
クにおいて有効であることを確認した.

3. ArtistVector: Web文書分散表現によるアーティスト特徴量獲得

篠井 暖 (ヤマハ)

音楽ファンにとって,自分の好みに合う新たな楽曲に出会えることは大きな喜
びである.近年の定額制音楽配信サービスの普及で膨大な量の楽曲を聴取可能
になった一方で,数百万〜数千万曲という規模の楽曲の中から好みに
合う楽曲をひとつひとつ試聴しながら探すのはもはや不可能になっており,リ
スナーの好みに合う楽曲を簡単に検索可能な仕組みが必要になっている.本稿
では,楽曲を探す際の有力な手がかりとしてアーティスト情報に着目し,アー
ティストの特徴抽出手法について検討する.アーティストに関する情報を記述
した文書の潜在表現を学習することによりアーティストのベクトル表現
(ArtistVector)を獲得し,クエリアーティストと類似するアーティストを検
索可能にする手法を提案する.アーティストを特徴づける文書として,(1)アー
ティスト自身の説明を記述した文書 と (2)リスナーからのアーティストの評価
を記述した文書 が重要になると考え,両者に対応する文書としてWikipedia記
事とWebレビュー記事を学習データに利用してArtistVectorを獲得した.得ら
れたArtistVectorに対しジャンル分類タスクによる評価を行い,データセット
および手法の有効性を検証した.またArtistVectorをUMAPにより2次元平面上
に可視化し,コンテキストに基づく関係性を反映した類似アーティストが得られ
ていることを確認した.

[11:45-13:30] 昼休み
[13:30-14:30] 招待講演

4. ニューラル構文解析とその周辺

能地 宏(産総研)

構文解析は自然言語処理において古典的な問題であるが、近年の深層学習の枠組
みの中では、不要な道具として扱われることも多い。しかしながら、深層学習は
構文解析の研究自体にもブレークスルーをもたらしており、特にこれまで考えら
れなかったほどの精度向上や、また実用的なドメイン適応など、構文解析に携わっ
てきた者としては、いよいよ実際に役に立つ道具になってきたのではないか、と
も思わされる。本講演の前半では、このような構文解析をめぐる研究の動向につ
いてまとめる。また近年の関連する話題として、RNNなどの線形モデルが文の階
層構造を捉えているか否か、という議論がある。このような研究は、ニューラル
ネットワークによる一貫学習の際に文構造などを明示的に考慮すべきかについて
示唆を与えるものとも言え、興味深い。後半はこれらの研究に焦点をあて、今後
の方向性について議論する。

[14:30-14:40] 休憩
[14:40-16:10] 言語処理応用 (3件)
5. Distant Supervisionによる質問要約

石垣 達也, 町田 和哉 (東工大), 小林 隼人 (ヤフー),
高村 大也 (東工大/産総研), 奥村 学 (東工大)

学会での質疑応答やEメールなどにおいて用いられる質問には、核となる文の他
に補足的な情報も含まれ、ときに冗長になる。本研究ではこのような長文質問を
その内容を端的に表現するより短い質問に要約する課題を扱う。既存研究では、
コミュニティQAサイトに投稿される質問の本文とタイトルの対を長文質問とその
要約とみなし、教師あり要約モデルを構築する手法が提案されている。しかし、
例えば日本語のYahoo! 知恵袋などにおいてはタイトルが存在せず、先行研究の
ように擬似的な教師データの獲得が難しい。そこで、本研究では、Distant
Supervisionの考えに基づく抽出型質問要約器を提案する。評価実験において、
提案要約器が教師あり及び教師なし学習に基づくベースライン手法よりも良い性
能を示した。

6. Exploring Crowdsourceable Annotation Protocol for Argumentation Schemes

Naoya Inoue (Tohoku Univ./RIKEN AIP), Paul Reisert (RIKEN AIP),
Kentaro Inui (Tohoku Univ./RIKEN AIP)

Argumentation scheme classification is an important core
technology for argumentation analysis. As of yet, however,
there is no reliable, large-scale corpus annotated with
argumentation schemes. To address this issue, this study
discusses the potential of crowdsourcing as a plausible way
for large-scale annotation of argumentation schemes. We report
ongoing efforts on crowdsourcing annotation of Argument from
Consequences for policy (should/should-not) arguments.
The preliminary experiments demonstrate that the annotation task
is reasonably achieved by crowdworkers.

7. 機械翻訳のための日本語若者言葉の言い換えに関する一考察

何 婉瑩 (東京都市大/大連交通大), ハダノウィチ アレクセイ, 藤田 和成,
浅沼 爽汰, 田村 亮介 , 町田 翔, 山田 紘司, 延澤 志保 (東京都市大)

翻訳機の精度は向上しているが,機械翻訳による翻訳文は直訳や誤った翻訳が多
く,特にSNSを最も多く使う若者たちが使っている若者言葉は正しく翻訳できる
ものがほぼない.日本語の若者言葉を含む句を機械翻訳器に翻訳させる際,前処
理として若者言葉部分を一般的な言い回しへ置換することで翻訳正解率は向上す
る.本稿では日本語の若者言葉を含む句を対象として言い換え処理を伴う機械翻
訳を行った結果について,対象言語が中国語の場合とロシア語の場合それぞれ分
析を行った結果をまとめる.

[16:20-17:50] 意見交換会


7月10日(火) 10:15-15:55 (7件)

[10:15-11:45] 構文解析・意味解析 (3件)
8. 重み行列の対称性および巡回性の仮定に基づく双アフィン分類器の冗長性削減

松野 智紀 (NAIST), 林 克彦 (阪大), 石原 敬大 (NAIST),
真鍋 陽俊 (ワークスアプリケーションズ), 松本 裕治 (NAIST)

現在,係り受け解析の分野ではDozat and Manning (2017)によって提案され
たDeep Biaffine parserがその非常に高い解析精度から注目を集めている.
一方で,そのスコア計算に用いられる双線型項の重み行列はシステム全体におけ
るパラメータの約19%を占めており,メモリや計算効率の観点から大きな問題と
なっている.本稿では重み行列に対称性あるいは巡回性という仮定を加えること
で,その問題を解決する新たな手法を提案する.CoNLL 2017 shared task
のデータセットを使った実験から,重み行列に巡回行列を用いたモデルではパラ
メータ数を18%以上削減できる上,ほとんどの言語でベースラインと同程度かそ
れ以上の解析精度を達成できる事がわかったので報告する.

9. 意味役割付与のためのスパン選択モデル

大内 啓樹 (理研/東北大), 進藤 裕之, 松本 裕治 (NAIST)

本稿では,スパン(フレーズ)に基づいた意味役割付与モデルを提案する.提案モ
デルは,可能なスパン集合のそれぞれにスコアをつけ,スコアの高いスパンを予
測として出力する.提案モデルの長所は,スパンレベルの特徴量を利用できる点
である.これは,BIOタグ付けに基づいた最先端の意味役割付与モデルでは利用
できなかったものである.実験の結果,本提案モデルがこれまでの英語意味役割
付与における最高精度を上回る性能であることを確認した.

10. 類似用例の利用により多義性に対応した日本語述語項構造解析

芝原 隆善 (NAIST), 濱口 拓男 (理研), 松本 裕治 (NAIST)

本研究では文内の日本語述語項構造解析に取り組む.述語項構造解析は文章内に
含まれる述語とその項の間の関係を推定するタスクであり,その推定には文の構
造を把握するだけではなく,指定された単語がどのような意味を持つか把握する
ことが重要である.単語の意味に関して,先行研究は2つのアプローチを取ってい
る.1つは用例の分類として定められた意味を利用するアプローチであり,もう
1つは単語埋め込みに意味を学習させる事前訓練によるアプローチである.これ
らのアプローチはそれぞれ利点を持つ反面,1つの共通した課題を持つ.それは
単語の意味を静的に決めてしまう点である.用例の分類として語義を定めるアプ
ローチは典型的な意味以外の用法や用例を捉えるのが難しい.事前学習による単
語埋め込みを用いるアプローチは,語義を固定長のベクトルに全て押し込めるた
め,多くの語義を持つ単語の意味を取りこぼしてしまう懸念がある.これらの課
題を解決するため,本研究では外部コーパスから動的に単語表現を獲得するアプ
ローチを取る.より具体的には,着目した単語に類似する用例を外部コーパスか
ら集め,それぞれに対してAttentionを用いることで,似た用例とそれに基づ
く単語表現を獲得することで,日本語述語構造解析をより効果的に解くことを
目指す.

[11:45-13:30] 昼休み
[13:30-14:30] 対話 (2件)
11. 高齢者と家族とのコミュニケーションの質の向上に向けて:高齢者のQuality of Life 表出発話の分析

徳久 良子, 寺嶌 立太 (豊田中研), 乾 健太郎 (東北大)

我々は,高齢者と家族とのコミュニケーションにおいて,高齢者のQOL表出発話
(聞き手が高齢者の発話から高齢者のQOL を推定できる発話) の生成をサポート
することで,高齢者のQOLを家族に伝え,両者のコミュニケーションの質を向上
させるシステムの構築を目指している.本稿では,高齢者と家族との対話を分析
し,右記の2点を明らかにする.(1) 高齢者と家族との通常の(システムのサポー
トのない)コミュニケーションにおいて高齢者のQOL がどのように表出するか.
(2)QOL表出発話にはどのような特徴があるか.クラウドソーシングで収集した
501名による発話を分析した結果,高齢者の行動や状態を表す発話,要望を表す
発話,具体的な内容を述べる発話が高齢者のQOL 表出発話の度合が高い発話で
あることが分かった.

12. タスク指向対話におけるユーザ要求の理解とその根拠の抽出

福永 隼也, 西川 仁, 徳永 健伸 (東工大), 横野 光, 高橋 哲朗 (富士通研)

本論文は,データベース検索を行うタスク指向型対話を対象として,ユーザ発話
中で明示的に述べられていないユーザ要求の解釈をおこなう手法を提案する.
ユーザ発話において,検索条件としてデータベースフィールドとその値が明示的
に指定されない場合,その発話を直接データベースへのクエリに変換することは
できない.しかし,そのような発話中にも明示的に述べられないユーザ要求が含
まれる場合があり,それを解釈することは,対話システムがより自然で効率的な
データベース検索対話をおこなうために重要である.本論文ではこのように明示
的に述べられないユーザ要求を非明示的条件と呼ぶ.また,非明示的条件の解釈
を,ユーザ発話を関連するデータベースフィールドに紐づけ,また同時にその根
拠となるユーザ発話中の文字列を抽出する課題として定式化する.このような新
しい課題を提案するとともに,課題に対する2つの手法として,サポートベクター
マシンに基づく手法と,分類と根拠となる部分文字列の抽出を同時に行うニュー
ラルネットワークによる手法を実装した.不動産に関する対話のコーパスを利用
した評価実験の結果,サポートベクターマシンに基づく手法がより良好な結果を
示すことがわかった.

[14:30-14:40] 休憩
[14:40-15:40] Web言語処理 (2件)
13. 政治情報の信憑性判断における情報アクセス技術の役割 -NTCIR-14 QA Lab-PoliInfoタスクの提案-

木村 泰知 (小樽商大/理研AIP), 渋木 英潔 (横浜国大), 阪本 浩太郎 (横浜国大/NII),
石下 円香 (NII), 三田村 照子 (CMU), 神門 典子 (NII/総研大)

本稿では、Web上の情報信憑性を扱った自然言語処理の分野における従来研究を
概観し、自然言語処理による情報アクセス技術を用いることで、Web上の政治情
報の信憑性を判断する上でどのように貢献できるか考察する。また、NTCIR-14
QA Lab-PoliInfoで我々が提案している3つのタスク、Segmentation Task、
Summarization Task、Classification Taskについて説明し、その位置づ
けを述べる。

14. 建設的ニュースコメントの順位付けのためのデータセット構築

藤田 綜一郎 (東工大), 小林 隼人 (ヤフー), 奥村 学 (東工大)

オンラインニュースサイトには,ニュース記事毎に読者の議論の場としてコメン
ト欄が設けられているものがある.そこではニュースに関する建設的なコメント
が投稿される一方で,差別的または特定の主義主張に偏ったコメントも投稿され
るため,活発な議論を促すコメントが埋もれてしまう可能性があるという問題が
ある.そこで,本稿では建設的なコメントを優先的に提示することによる議論の
活性化を目指し,コメントを建設的なコメント順に並び変えることを試みる.具
体的には,コメントの建設的度合いをスコア化したデータセットを構築し,ラン
キング学習を用いて順位付けを行う.加えて,その応用として,効率的なデータ
の拡張による順位付けの精度向上を目的に,能動学習を用いてランキングモデル
を学習する方法について考察する.


[15:40-15:55] クロージング
=============================


★研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行い
ません.また,特許出願の公知日(研究報告の公開日)が従来より1週間
早まりますので,ご留意ください.

※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.

情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).

★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
http://www.ipsj.or.jp/kenkyukai/toroku.html

★研究会幹事団
主査:
関根聡  (理化学研究所)
幹事:
荒瀬由紀 (大阪大学)
木村俊也 (株式会社メルカリ)
進藤裕之 (奈良先端科学技術大学院大学)
中澤敏明 (東京大学)
西川仁  (東京工業大学)
桝井文人 (北見工業大学)
横野光  (株式会社富士通研究所)
運営委員:
浅原正幸 (国立国語研究所)
荒牧英治 (奈良先端科学技術大学院大学)
石野亜耶 (広島経済大学)
内海慶  (株式会社デンソーアイティーラボラトリ)
内田ゆず (北海学園大学)
小林隼人 (Yahoo! JAPAN 研究所)
佐々木稔 (茨城大学)
笹野遼平 (名古屋大学)
貞光九月 (フューチャー株式会社)
佐藤敏紀 (LINE株式会社)
数原良彦 (Recruit Institute of Technology)
高村大也 (産業技術総合研究所/東京工業大学)
土田正明 (株式会社コトバデザイン)
徳永拓之
二宮崇  (愛媛大学)
羽鳥潤  (株式会社 Preferred Networks)
藤田早苗 (日本電信電話株式会社)
牧野拓哉 (株式会社富士通研究所)
松崎拓也 (名古屋大学)
松林優一郎(東北大学)
ミハウ・プタシンスキ(北見工業大学)
村脇有吾 (京都大学)
若木裕美 (ソニー株式会社)

発表募集

情報処理学会 第236回自然言語処理研究会 発表募集
https://nl-ipsj.or.jp

●日程: 2018年7月9日(月),10日(火)

●会場: 理化学研究所 革新知能統合研究センター (AIP)
コレド日本橋15階
https://aip.riken.jp/access

●発表申込締切: 2018年6月1日(金)
●原稿締切: 2018年6月15日(金) ※厳守

●原稿ページ数:2ページ以上
電子化にともないページ数に上限はありません.
※ただし20ページを越える場合は事前にご連絡ください.

●発表時間予定: 一般講演形式 1件30分 (発表20分、質疑10分)

※ 発表時間の調整について
従来の一般講演形式(発表20分,質疑10分)に加えてショート形式(発表10分,
質疑10分),討議形式(発表10分,質疑討論20分)など,発表者からの要望
に応じて発表の合計時間を調整します.アイデアレベルの研究
の紹介や,研究の詳細まで話したいので時間がほしい,などの要求を発表
申込の備考欄にご記入いただければ,それらを考慮してプログラムを作成
します.ぜひご活用ください.

●優秀研究賞
研究会に投稿された予稿の中から特に優れたものを優秀研究賞として表彰
する予定です.

●発表申込先: 下記専用サイトよりお申込みください.
https://ipsj1.i-product.biz/ipsjsig/NL/
(研究会ホームページからもアクセスできます)

●動画中継
今回の研究会では,インターネットを利用した研究発表の動画中継を予定
しております.基本的にすべての発表を動画中継の対象とする予定ですが,
発表者の希望により対象から外すことも出来ますので,研究発表の当日に
その旨お伝えください.動画中継の詳細については,追ってアナウンス
いたします.

●問い合わせ先:
横野光((株)富士通研究所)
E-mail: yokono.hikaru (at) jp.fujitsu.com

●今後の予定
第237回研究会 2018年9月予定

★研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行い
ません.また,特許出願の公知日(研究報告の公開日)が従来より1週間
早まりますので,ご留意ください.

※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.

情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).

★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
http://www.ipsj.or.jp/kenkyukai/toroku.html

★受け付けは先着順で行なっております
多数のお申し込みを頂いた場合,次回の研究会にまわって頂くよう
お願いする場合があります.なるべく早めにお申し込み下さい.

★締め切り後の発表キャンセルは原則としてできません
発表申し込み後にキャンセルの必要が生じた場合は,至急ご連絡ください.
発表申込後,原稿提出締め切りまでに原稿が到着しない場合には,幹事団の
判断により発表を取り消しさせていただくこともあります.

★論文提出締切後の原稿差し替えはできません
論文提出締切後は,訂正版のアップロードやウェブ上での配布などの原稿
差し替えは一切できませんので,予めご留意ください.
※正誤表の掲載が可能な場合がありますのでご相談ください.

★研究会幹事団
主査:
関根聡  (理化学研究所)
幹事:
荒瀬由紀 (大阪大学)
木村俊也 (株式会社メルカリ)
進藤裕之 (奈良先端科学技術大学院大学)
中澤敏明 (東京大学)
西川仁  (東京工業大学)
桝井文人 (北見工業大学)
横野光  (株式会社富士通研究所)
運営委員:
浅原正幸 (国立国語研究所)
荒牧英治 (奈良先端科学技術大学院大学)
石野亜耶 (広島経済大学)
内海慶  (株式会社デンソーアイティーラボラトリ)
内田ゆず (北海学園大学)
小林隼人 (Yahoo! JAPAN 研究所)
佐々木稔 (茨城大学)
笹野遼平 (名古屋大学)
貞光九月 (フューチャー株式会社)
佐藤敏紀 (LINE株式会社)
数原良彦 (Recruit Institute of Technology)
高村大也 (産業技術総合研究所/東京工業大学)
土田正明 (株式会社コトバデザイン)
徳永拓之
二宮崇  (愛媛大学)
羽鳥潤  (株式会社 Preferred Networks)
藤田早苗 (日本電信電話株式会社)
牧野拓哉 (株式会社富士通研究所)
松崎拓也 (名古屋大学)
松林優一郎(東北大学)
ミハウ・プタシンスキ(北見工業大学)
村脇有吾 (京都大学)
若木裕美 (ソニー株式会社)