第235回NL・第121回SLP合同研究発表会

第235回自然言語処理・第121回音声言語情報処理合同研究発表会

標記の研究発表会はペーパレスで行います（貸し出し用のUSBメモリもご用意しています）。

研究会に登録されている方
研究報告は開催初日の1週間前（＝公知日）に電子図書館と当日用サイト（登録会員用）で公開します。
研究会に登録されていない方
当日受付で資料閲覧用のアカウント情報（URL，ID，PW）をお渡しいたします。
尚、研究会にご登録いただくことで当研究会のバックナンバーも含めて全て電子図書館でご購読いただけます。登録に関しては「研究会に登録する」のページをご参照ください。

開催案内

●日程：2018年5月13日（日）（開催は1日のみになりました）

●会場：東京大学本郷キャンパス工学部２号館３階電気系会議室１

キャンパスマップ：

http://www.u-tokyo.ac.jp/campusmap/map01_01_j.html

アクセスマップ：

http://www.u-tokyo.ac.jp/campusmap/map01_02_j.html

============================

●研究会に関する問い合わせ先:

NL研究会: 中澤敏明（東京大学），荒瀬由紀（大阪大学）

E-mail: nakazawa (at) logos.t.u-tokyo.ac.jp

E-mail: arase (at) ist.osaka-u.ac.jp

SLP研究会: 西村雅史（静岡大学）

E-mail: nisimura (at) inf.shizuoka.ac.jp

会場係: 峯松信明（東京大学）

E-mail: mine (at) gavo.t.u-tokyo.ac.jp

============================

プログラム（発表件数7件）

5月13日（日）10:00-16:30

[10:00-11:00] 生成・合成 [2件]

[11:00-12:00] 招待講演 [1件]

[12:00-13:30] 昼食休憩

[13:30-14:30] 学生セッション (1) [2件]

[14:30-14:45] 休憩

[14:45-15:45] 学生セッション (2)・知識獲得 [2件]

[15:45-16:00] クロージング

5月13日（日）10:00-16:30

[10:00-11:00] 生成・合成 [2件]

座長：貞光九月（フューチャー株式会社）

(1) [NL] 深層学習を用いた俳句の自動生成

太田瑶子,進藤裕之,松本裕治 (NAIST)

文学の一つとして詩がある．詩は言葉の表面的な意味だけでなく，言葉が持つ

美学的・喚起的な性質を用いて表現される．詩は短い文字列であっても，詩と

して表現する事で，言葉の持つ奥深さによってその場の雰囲気を封じ込めるこ

とが出来る．しかし，実際にいざ詩を作ろうとすると，どのように始めれば良

いのか難しい．そのような場合であっても，手軽に詩を作れるようにしたいと

考えた．本研究では，詩の中でも有季定型俳句を選び，言葉を入力することに

より俳句の自動生成を行った．本研究ではより柔軟な表現が生成できるように，

深層学習を使った．また，韻律や季語のような有季定型俳句の規定を素性や制

限として用いた．俳句としての体をなすような生成結果が得られた．

(2) [SLP] 日本語韻律構造を考慮したprosody-aware subword embeddingとDNN多方言音声合成への適用

高道慎之介, 秋山貴則, 猿渡洋 (東大)

音声合成技術の急速な発展に伴い，日本共通語の音声合成に留まらない次世代

音声合成技術が必要とされている．その1つとして我々は，特定話者の声色で

あらゆる日本語方言の音声を合成できる多方言音声合成の研究を実施しており，

本稿は，そのための韻律コンテキスト生成を扱う．韻律規則が古くから研究さ

れている日本共通語では，規則及び辞書ベースの韻律コンテキスト生成が可能

だが，多様な方言を扱う多方言音声合成では，各方言に対してそのような韻律

規則を決定することは現実的ではない．一方，音声コーパスから韻律コンテキ

ストを教師なし推定する prosody-aware word embedding が提案され，英語音

声合成における有効性が報告されている．しかしながらこの手法は，方言に含

まれる未知語の韻律コンテキストを適切に生成できず，また，利用する韻律情

報に過不足がある．これに対し本稿では，日本語韻律構造を考慮した

prosody-aware subword embedding を提案する．日本語テキストは出現文字頻

度と日本語韻律構造に基づいて subword 系列に分割されるため，未知単語を

既知 subword 系列に効果的に分割できる．本稿では更に，この提案法を多方

言音声合成に適用し，方言混合 subword モデリングと，多方言 subword

embedding を提案する．実験的評価では，日本共通語および20の方言の音声合

成において主観評価を実施し，提案法の有効性を示す．

[11:00-12:00] 招待講演 [1件]

座長：関根聡（理化学研究所）

(3) Linguistic insights in text normalization

Kyle Gorman (Google)

Many speech and language applications, including speech recognition
and synthesis, require mappings between "written" and "spoken" (e.g.,
pronounceable) forms of entities like cardinal and ordinal numbers,
dates and times, and the like (e.g., “$328” vs. “three hundred twenty
eight dollars”). Collectively, such conversions are known as text
normalization. Despite substantial progress in applied machine
learning, it is still the case that real-world text-to-speech (TTS)
synthesis systems largely depend on language-specific hand-written
rules. These may require a great deal of development effort and
linguistic sophistication and as such, represent substantial barriers
for quality control and internationalization.

I first consider the case of number names. I propose two types of
computational models for learning this mapping. The first uses
end-to-end recurrent neural networks. The second, inspired by prior
literature on cross-linguistic variation in number systems, uses an
induction strategy based on finite-state transducers. While both
models achieve near-perfect performance, the latter model can be
trained using several orders of magnitude less data, making it
particularly useful for low-resource languages. The latter model is
currently being used at Google to develop new number name grammars for
hundreds of languages.

I then consider homographs, i.e., words whose pronunciation depends on
the intended sense (e.g., "read", which can either rhyme with "feed"
or "fed"). I describe an existing rule-based system and compare it to
a novel system which performs homograph disambiguation using simple
machine learning. An evaluation of these two systems, using a new,
freely-available data set, finds that a hybrid system (using both
rules and machine learning) is significantly more accurate than either
rules or machine learning alone. This new hybrid system is used on all
English TTS traffic at Google.

[12:00-13:30] 昼食休憩

[13:30-14:30] 学生セッション (1) [2件]

座長：木村俊也（株式会社メルカリ）

(4) [NL] 統計的翻訳とニューラル翻訳に基づく翻訳候補文の分散表現と逆翻訳によるリスコアリングの検討

佐橋広也, 西村友樹, 秋葉友良 (豊橋技科大), 中川聖一 (中部大/豊橋技科大)

近年、ニューラル機械翻訳(NMT)が目覚ましい発展を遂げており、従来の統計

的翻訳機械翻訳(SMT)の性能を上回っている。しかしNMTはSMTに比べ、学習に

必要なパラレルコーパスの量が十分でなければ、翻訳性能を向上させることが

難しく、翻訳の語彙サイズについても制限を持つ。そのため機械翻訳の候補

をリスコアリングし、性能を向上させる研究が複数報告されている。 SMTでは

ラティスデコーディングを使用した翻訳候補のリスコアリングが行われている。

NMTでは翻訳候補を別のNMTで再度スコアを評価しリスコアリングする方法が報

告されている。 SMTとNMTでは同じ文でも翻訳結果が異なることが多く、両手

法を相補的に使用する方法が考えられる。そこで、SMTとNMT両方を併用した

翻訳システムとして、SMTのシステムやフレーズテーブルを組み込んだNMTの報

告がされている。本稿では同じパラレルコーパスで学習したNMTとSMTの翻訳

文を比較し、人為的、または文の分散表現ベクトルを利用して自動的にリスコ

アリングする手法を報告する。

(5) [NL] 敵対的生成を利用した校正要否の識別

竹中誠 (首都大), 柳瀬利彦, 小泉敦子 (日立製作所), 江原遥 (産総研)

文章の校正は一般には人手によるものであり，これを自動化することは人手コ

スト削減に大きな寄与を果たす．本研究ではマニュアル文の自動校正を見据え，

校正要否の識別性能を向上させる手法を提案する．校正要否の識別において解

くべきタスクは，校正対象の文章を入力とした二値分類タスクである．マニュ

アルにおいて校正前の文は一般には公開されていないため，分類器の教師あり

学習で利用するほど大量の校正前の文を入手することは困難である．一方，校

正後の文章は大量に存在する．そこで本研究では，校正後の文から擬似的に校

正が必要な文を生成し，教師データとして利用する方法を提案する．提案手法

では，人手で書かれた文か生成された文かを見分ける分類器を活用する．これ

により，人手で書かれた文と近い校正が必要な文を生成する．実験では，提案

手法で拡張した教師データを利用することで，要否の識別性能が向上すること

を確認した．また，マニュアル文の特性から導かれる擬似データ生成による精

度向上の限界を議論した．

[14:30-14:45] 休憩

[14:45-15:45] 学生セッション (2)・知識獲得 [2件]

座長：江原遥 (産総研)

(6) [NL] 雑談対話システムのための興味推定

田中昂志, 高山隼矢, 荒瀬由紀 (阪大)

近年，人間との雑談を目的とした対話システムが広く普及している．雑談対話

システムが多くのユーザに長期的に利用されるためには，出身地や性格等のユー

ザ情報に沿った会話が有効であると期待される．本研究では，そのようなユー

ザ情報の中でもユーザの興味に焦点を当てる．一方，ユーザが興味を持つ表

現は対話システム側のコーパス内に入っていない新単語であることが多い．対

話システム内の興味推定部が新単語に対しても推定できることは，任意の表現

に対して興味の有無を推定するために必要不可欠である．しかし，興味推定を

タスクとしている研究は数多くあるが，未知語を考慮している研究は少ない．

そこで，本研究では対話文における未知語を含んだ興味対象の推定を目的とす

る．

(7) [NL] Block HolE: 関係行列の同時対角化に基づく知識グラフ埋め込みモデルの問題点とその解決

林克彦 (阪大), 真鍋陽俊, 石原敬大, 新保仁 (NAIST)

近年、知識グラフ埋め込みに関する研究が盛んに行われている。知識グラフ埋

め込みは、未知の事実に対しても、その真偽値をスコア化することができるた

め、知識グラフ補完や質問応答などのタスクに応用されている。埋め込みモデ

ルは、双線形、平行移動、ニューラルネットに基づく変換を用いた3種類のモ

デルに大別されるが、近年、平行移動、及び、ニューラルネットに基づくモデ

ルはいくつかの問題点が指摘されており、現在では双線形モデルが主流となっ

ている。しかし、DistMult、HolE、ComplEx等の双線形モデルは関係を表す行

列を同時対角化して導出するため、関係行列同士が可換となる。本稿では関係

行列における可換性の仮定がもたらす実用上の致命的な問題を指摘し、それを

解決する新しい知識グラフ埋め込みモデルを提案する。

[15:45-16:00] クロージング

============================

※自然言語処理研究会に登録されている方

研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開

します．当日は資料をプリントアウトしてご持参いただくか，ご自身の

PCにダウンロードのうえ，ご持参ください．

情報処理学会電子図書館（情報学広場）

https://ipsj.ixsq.nii.ac.jp/ej/　（ユーザ登録が必要です）

当日閲覧用サイト

http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方

当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します．

当日はノートPC等をご持参ください．なお，当研究会にご登録頂くことで，

本研究会の資料をバックナンバーも含めて電子図書館で購読できます．

登録されていない方は，是非この機会に研究会に登録してください

（登録まで最大3日かかりますのでご留意ください）．

★研究会への登録をお勧めします

年に２回以上の参加を見込まれる方は，研究会に登録される方が（ほぼ）

お得になります．研究会登録は以下のウェブサイトから行えます．

http://www.ipsj.or.jp/kenkyukai/toroku.html

============================

★NL研究会幹事団

主査：

関根聡　　（理化学研究所）

幹事：

荒瀬由紀　（大阪大学）

木村俊也　（株式会社メルカリ）

進藤裕之　（奈良先端科学技術大学院大学）

中澤敏明　（東京大学）

西川仁　　（東京工業大学）

桝井文人　（北見工業大学）

横野光　　（株式会社富士通研究所）

運営委員：

浅原正幸　（国立国語研究所）

荒牧英治　（奈良先端科学技術大学院大学）

石野亜耶　（広島経済大学）

内海慶　　（株式会社デンソーアイティーラボラトリ）

内田ゆず　（北海学園大学）

小林隼人　（Yahoo! JAPAN 研究所）

佐々木稔　（茨城大学）

笹野遼平　（名古屋大学）

貞光九月　（フューチャー株式会社）

佐藤敏紀　（LINE株式会社）

数原良彦　（Recruit Institute of Technology）

高村大也　（産業技術総合研究所／東京工業大学）

土田正明　（株式会社コトバデザイン）

徳永拓之

二宮崇　　（愛媛大学）

羽鳥潤　　（株式会社 Preferred Networks）

藤田早苗　（日本電信電話株式会社）

牧野拓哉　（株式会社富士通研究所）

松崎拓也　（名古屋大学）

松林優一郎（東北大学）

ミハウ・プタシンスキ（北見工業大学）

村脇有吾　（京都大学）

若木裕美　（ソニー株式会社）

★SLP研究会幹事団

主査：

西村雅史　（静大）

幹事：

山岸順一　（NII）

福田隆　　（日本IBM）

塩田さやか（首都大）

俵直弘　　（早稲田）

発表募集

第235回自然言語処理研究会 (SIG-NL)
第121回音声言語情報処理研究会 (SIG-SLP)
合同研究会　論文募集

12日はLREC＠宮崎の最終日と重なっていますので，
13日での発表希望の方は，その旨連絡していただければと思います。

例年学生セッションを開催し，優秀な発表を表彰しています。
皆様のご投稿をお待ちしております。

----------------------------------------------------------------------
第121回音声言語情報処理研究会 (SIG-SLP) http://sig-slp.jp/
第235回自然言語処理研究会 (SIG-NL) http://www.nl-ipsj.or.jp/
共催研究会　論文募集
----------------------------------------------------------------------
●日程: 2018年5月~~12日(土)・~~13日(日) ※13日のみの1日開催に変更になりました。
●会場: 東京大学本郷キャンパス工学部２号館３階電気系会議室１（予定）
キャンパスマップ：http://www.u-tokyo.ac.jp/campusmap/map01_01_j.html
アクセスマップ：http://www.u-tokyo.ac.jp/campusmap/map01_02_j.html
●発表申込締切: 2018年4月9日(月)
●原稿締切: 2018年4月17日(火) ※厳守
●原稿ページ数: ２ページ～
電子化に伴いページ数に制限はありません．
ただし，20ページを越える場合は事前にご連絡ください．
●発表時間予定: 1件につき30分（発表20分，質疑10分）
※発表時間の調整について
従来の一般形式（発表20分，質疑10分）に加えてショート形式（発表10分，
質疑10分），討議形式（発表10分，質疑討論20分）など，発表者からの
要望に応じて発表の合計時間を調整したいと思います．アイデアレベルの
研究の紹介や，研究の詳細まで話したいので時間が欲しい，等のご要望を
発表申込の備考欄にご記入いただければ，それらを考慮してプログラムを
編成したいと思います．ぜひご活用ください．
●NL/SLP合同企画: 学生セッション
SIG-NLとSIG-SLPの合同企画として，学生セッションを開催いたします．
卒業論文，修士論文でまとめられた研究成果などが発表されます．優秀な
論文発表には，学生奨励賞を進呈し表彰します．なお，同賞の受賞対象者
は，発表時に情報処理学会学生会員で，かつ，自然言語処理研究会または
音声言語情報処理研究会の登録会員といたします．情報処理学会学生会員
の方は，研究会登録費無料制度をご利用いただけます．詳細は下記をご覧
ください．
http://www.ipsj.or.jp/kenkyukai/student.html

●優秀研究賞（NL研に投稿された論文のみ対象）
研究会に投稿された予稿の中から特に優れたものを優秀研究賞として表彰する予定です．

●動画収録・中継について
今回の研究会では，インターネットを利用した研究発表の動画配信を行う予定です．
基本的にすべての発表を配信する予定ですが，発表者の希望に応じられますので，
原稿申し込み時に備考欄にその旨お書きください．
また，研究発表の当日に変更することも可能です．

●発表申込先: 下記専用サイトよりお申込みください．
NL研究会へお申込みの方:https://ipsj1.i-product.biz/ipsjsig/NL/
SLP研究会へお申込みの方:https://ipsj1.i-product.biz/ipsjsig/SLP/

※以下の質問の答えを変更して下さい（YesかNoでお願いします）．
学生セッションでの発表を希望: No
当日の発表の動画配信可否: Yes

※変更しない場合は規定の設定（学生セッション希望せず，動画配信可）となります.

●研究会に関する問い合わせ先:
NL研究会: 中澤敏明（科学技術振興機構），荒瀬由紀（大阪大学）
E-mail: nakazawa (at) nlp.ist.i.kyoto-u.ac.jp
E-mail: arase (at) ist.osaka-u.ac.jp

SLP研究会: 西村雅史（静岡大学）
E-mail: nisimura (at) inf.shizuoka.ac.jp
会場係：峯松信明（東京大学）
E-mail: mine (at) gavo.t.u-tokyo.ac.jp

★研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり，印刷した研究報告の配布を行い
ません．また，特許出願の公知日（研究報告の公開日）が従来より1週間
早まりますので，ご留意ください．

※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開します．
当日は資料をプリントアウトしてご持参いただくか，ご自身のPCにダウンロードのうえ，
ご持参ください．

情報処理学会電子図書館（情報学広場）
https://ipsj.ixsq.nii.ac.jp/ej/　（ユーザ登録が必要です）

当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します．
当日はノートPC等をご持参ください．なお，当研究会にご登録頂くことで，
本研究会の資料をバックナンバーも含めて電子図書館で購読できます．
登録されていない方は，是非この機会に研究会に登録してください
（登録まで最大3日かかりますのでご留意ください）．

★研究会への登録をお勧めします
年に２回以上の参加を見込まれる方は，研究会に登録される方が（ほぼ）
お得になります．研究会登録は以下のウェブサイトから行えます．
http://www.ipsj.or.jp/kenkyukai/toroku.html

★受け付けは先着順で行なっております
多数のお申し込みを頂いた場合，次回の研究会にまわって頂くようお願いする
場合があります．なるべく早めにお申し込み下さい．

★締め切り後の発表キャンセルは原則としてできません
発表申し込み後にキャンセルの必要が生じた場合は，至急ご連絡ください．
発表申込後，原稿提出締め切りまでに原稿が到着しない場合には，幹事団の
判断により発表を取り消しさせていただくこともあります．

★論文提出締切後の原稿差し替えはできません
論文提出締切後は，訂正版のアップロードやウェブ上での配布などの原稿
差し替えは一切できませんので，予めご留意ください．
※正誤表の掲載が可能な場合がありますのでご相談ください．

★SLP研究会幹事団
主査：西村雅史（静大）
幹事：山岸順一（NII）
福田隆（日本IBM）
　　　塩田さやか（首都大）
　俵直弘　　（早稲田）

★NL研究会幹事団
主査：関根聡（理研）
幹事：荒瀬由紀（大阪大学）
　木村俊也（株式会社メルカリ）
　進藤裕之（奈良先端科学技術大学院大学）
　中澤敏明（科学技術振興機構）
　西川仁（東京工業大学）
　桝井文人（北見工業大学）
　横野光（株式会社富士通研究所）

運営委員：
　浅原正幸（国立国語研究所）
　荒牧英治（奈良先端科学技術大学院大学）
　石野亜耶（広島経済大学）
　内海慶　（株式会社デンソーアイティーラボラトリ）
　内田ゆず（北海学園大学）
　小林隼人（Yahoo! JAPAN 研究所）
　佐々木稔（茨城大学）
　笹野遼平（名古屋大学）
　貞光九月（フューチャーアーキテクト株式会社）
佐藤敏紀（LINE株式会社）
　数原良彦（Recruit Institute of Technology）
　高村大也（産業技術総合研究所／東京工業大学）
　土田正明（株式会社ディー・エヌ・エー）
徳永拓之
　二宮崇（愛媛大学）
　羽鳥潤（株式会社 Preferred Networks）
　藤田早苗（日本電信電話株式会社）
　牧野拓哉（株式会社富士通研究所）
　松崎拓也（名古屋大学）
　松林優一郎（東北大学）
　ミハウ・プタシンスキ（北見工業大学）
　村脇有吾（京都大学）
　若木裕美（ソニー株式会社）