第235回NL・第121回SLP合同研究発表会
第235回自然言語処理・第121回音声言語情報処理合同研究発表会
開催案内
Kyle Gorman (Google)
Many speech and language applications, including speech recognition
and synthesis, require mappings between "written" and "spoken" (e.g.,
pronounceable) forms of entities like cardinal and ordinal numbers,
dates and times, and the like (e.g., “$328” vs. “three hundred twenty
eight dollars”). Collectively, such conversions are known as text
normalization. Despite substantial progress in applied machine
learning, it is still the case that real-world text-to-speech (TTS)
synthesis systems largely depend on language-specific hand-written
rules. These may require a great deal of development effort and
linguistic sophistication and as such, represent substantial barriers
for quality control and internationalization.
I first consider the case of number names. I propose two types of
computational models for learning this mapping. The first uses
end-to-end recurrent neural networks. The second, inspired by prior
literature on cross-linguistic variation in number systems, uses an
induction strategy based on finite-state transducers. While both
models achieve near-perfect performance, the latter model can be
trained using several orders of magnitude less data, making it
particularly useful for low-resource languages. The latter model is
currently being used at Google to develop new number name grammars for
hundreds of languages.
I then consider homographs, i.e., words whose pronunciation depends on
the intended sense (e.g., "read", which can either rhyme with "feed"
or "fed"). I describe an existing rule-based system and compare it to
a novel system which performs homograph disambiguation using simple
machine learning. An evaluation of these two systems, using a new,
freely-available data set, finds that a hybrid system (using both
rules and machine learning) is significantly more accurate than either
rules or machine learning alone. This new hybrid system is used on all
English TTS traffic at Google.
発表募集
第235回 自然言語処理研究会 (SIG-NL)
第121回 音声言語情報処理研究会 (SIG-SLP)
合同研究会 論文募集
12日はLREC@宮崎の最終日と重なっていますので,
13日での発表希望の方は,その旨連絡していただければと思います。
例年学生セッションを開催し,優秀な発表を表彰しています。
皆様のご投稿をお待ちしております。
----------------------------------------------------------------------
第121回音声言語情報処理研究会 (SIG-SLP) http://sig-slp.jp/
第235回自然言語処理研究会 (SIG-NL) http://www.nl-ipsj.or.jp/
共催研究会 論文募集
----------------------------------------------------------------------
●日程: 2018年5月12日(土)・13日(日) ※13日のみの1日開催に変更になりました。
●会場: 東京大学本郷キャンパス工学部2号館3階電気系会議室1(予定)
キャンパスマップ:http://www.u-tokyo.ac.jp/campusmap/map01_01_j.html
アクセスマップ:http://www.u-tokyo.ac.jp/campusmap/map01_02_j.html
●発表申込締切: 2018年4月9日(月)
●原稿締切: 2018年4月17日(火) ※厳守
●原稿ページ数: 2ページ~
電子化に伴いページ数に制限はありません.
ただし,20ページを越える場合は事前にご連絡ください.
●発表時間予定: 1件につき30分(発表20分,質疑10分)
※発表時間の調整について
従来の一般形式(発表20分,質疑10分)に加えてショート形式(発表10分,
質疑10分),討議形式(発表10分,質疑討論20分)など,発表者からの
要望に応じて発表の合計時間を調整したいと思います.アイデアレベルの
研究の紹介や,研究の詳細まで話したいので時間が欲しい,等のご要望を
発表申込の備考欄にご記入いただければ,それらを考慮してプログラムを
編成したいと思います.ぜひご活用ください.
●NL/SLP合同企画: 学生セッション
SIG-NLとSIG-SLPの合同企画として,学生セッションを開催いたします.
卒業論文,修士論文でまとめられた研究成果などが発表されます.優秀な
論文発表には,学生奨励賞を進呈し表彰します.なお,同賞の受賞対象者
は,発表時に情報処理学会学生会員で,かつ,自然言語処理研究会または
音声言語情報処理研究会の登録会員といたします.情報処理学会学生会員
の方は,研究会登録費無料制度をご利用いただけます.詳細は下記をご覧
ください.
http://www.ipsj.or.jp/kenkyukai/student.html
●優秀研究賞(NL研に投稿された論文のみ対象)
研究会に投稿された予稿の中から特に優れたものを優秀研究賞として表彰する予定です.
●動画収録・中継について
今回の研究会では,インターネットを利用した研究発表の動画配信を行う予定です.
基本的にすべての発表を配信する予定ですが,発表者の希望に応じられますので,
原稿申し込み時に備考欄にその旨お書きください.
また,研究発表の当日に変更することも可能です.
●発表申込先: 下記専用サイトよりお申込みください.
NL研究会へお申込みの方:https://ipsj1.i-product.biz/ipsjsig/NL/
SLP研究会へお申込みの方:https://ipsj1.i-product.biz/ipsjsig/SLP/
※以下の質問の答えを変更して下さい(YesかNoでお願いします).
学生セッションでの発表を希望: No
当日の発表の動画配信可否: Yes
※変更しない場合は規定の設定(学生セッション希望せず,動画配信可)となります.
●研究会に関する問い合わせ先:
NL研究会: 中澤敏明(科学技術振興機構),荒瀬由紀(大阪大学)
E-mail: nakazawa (at) nlp.ist.i.kyoto-u.ac.jp
E-mail: arase (at) ist.osaka-u.ac.jp
SLP研究会: 西村雅史(静岡大学)
E-mail: nisimura (at) inf.shizuoka.ac.jp
会場係:峯松信明(東京大学)
E-mail: mine (at) gavo.t.u-tokyo.ac.jp
★研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行い
ません.また,特許出願の公知日(研究報告の公開日)が従来より1週間
早まりますので,ご留意ください.
※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開します.
当日は資料をプリントアウトしてご持参いただくか,ご自身のPCにダウンロードのうえ,
ご持参ください.
情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/
※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).
★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
http://www.ipsj.or.jp/kenkyukai/toroku.html
★受け付けは先着順で行なっております
多数のお申し込みを頂いた場合,次回の研究会にまわって頂くようお願いする
場合があります.なるべく早めにお申し込み下さい.
★締め切り後の発表キャンセルは原則としてできません
発表申し込み後にキャンセルの必要が生じた場合は,至急ご連絡ください.
発表申込後,原稿提出締め切りまでに原稿が到着しない場合には,幹事団の
判断により発表を取り消しさせていただくこともあります.
★論文提出締切後の原稿差し替えはできません
論文提出締切後は,訂正版のアップロードやウェブ上での配布などの原稿
差し替えは一切できませんので,予めご留意ください.
※正誤表の掲載が可能な場合がありますのでご相談ください.
★SLP研究会幹事団
主査:西村雅史(静大)
幹事:山岸順一(NII)
福田隆(日本IBM)
塩田さやか(首都大)
俵直弘 (早稲田)
★NL研究会幹事団
主査:関根聡(理研)
幹事:荒瀬由紀(大阪大学)
木村俊也(株式会社メルカリ)
進藤裕之(奈良先端科学技術大学院大学)
中澤敏明(科学技術振興機構)
西川仁(東京工業大学)
桝井文人(北見工業大学)
横野光(株式会社富士通研究所)
運営委員:
浅原正幸(国立国語研究所)
荒牧英治(奈良先端科学技術大学院大学)
石野亜耶(広島経済大学)
内海慶 (株式会社デンソーアイティーラボラトリ)
内田ゆず(北海学園大学)
小林隼人(Yahoo! JAPAN 研究所)
佐々木稔(茨城大学)
笹野遼平(名古屋大学)
貞光九月(フューチャーアーキテクト株式会社)
佐藤敏紀(LINE株式会社)
数原良彦(Recruit Institute of Technology)
高村大也(産業技術総合研究所/東京工業大学)
土田正明(株式会社ディー・エヌ・エー)
徳永拓之
二宮崇(愛媛大学)
羽鳥潤(株式会社 Preferred Networks)
藤田早苗(日本電信電話株式会社)
牧野拓哉(株式会社富士通研究所)
松崎拓也(名古屋大学)
松林優一郎(東北大学)
ミハウ・プタシンスキ(北見工業大学)
村脇有吾(京都大学)
若木裕美(ソニー株式会社)