第242回NL研究発表会

第242回自然言語処理研究発表会

標記の研究発表会はペーパレスで行います(貸し出し用のUSBメモリもご用意しています)。
  • 研究会に登録されている方
    研究報告は開催初日の1週間前(=公知日)に電子図書館(情報学広場)で公開します。
    ※2019年度より研究発表会当日用サイトのID・パスワードの事前配布は行わないことになりました。研究会に登録されている方で研究発表会に参加されない場合の論文のダウンロードには上記電子図書館をご利用くださいますようお願いいたします。

  • 研究会に登録されていない方
    当日受付で資料閲覧用のアカウント情報(URL,ID,PW)をお渡しいたします。
    尚、研究会にご登録いただくことで当研究会のバックナンバーも含めて全て電子図書館でご購読いただけます。登録に関しては 研究会に登録する」のページをご参照ください。

開催案内

情報処理学会 第242回自然言語処理研究会 参加募集
https://nl-ipsj.or.jp

●日程: 2019年10月25日(金),26日(土)

●会場: 奈良先端科学技術大学院大学 情報科学棟 L2教室
(〒630-0192 奈良県生駒市高山町8916−5)
http://www.naist.jp/accessmap/
正門を入って正面の赤い建物が情報科学棟です.

●懇親会:
10/25(金)に会場周辺にて懇親会を開催する予定です.
参加を希望される方は10月18日(金)までに下記フォームにご回答ください.
https://forms.gle/FYj4gQVmHRpap4Fr5

●問い合わせ先:
進藤裕之(奈良先端科学技術大学院大学)
E-mail: shindo (at)is.naist.jp

===============
プログラム

10月25日(金)
[13:30-13:40] オープニング
[13:40-14:40] 招待講演
[14:40-15:00] 休憩
[15:00-16:30] 生成・翻訳(3件)
[18:00-] 懇親会

10月26日(土)
[10:30-11:30] 招待講演
[11:30-13:00] 昼休み
[13:00-14:00] 言語処理応用(2件)
[14:00-14:15] 休憩
[14:15-15:15] 招待講演
[15:15-15:30] クロージング

※若手奨励賞の対象者には著者名の前に「〇」を付けています.
※発表20分,質疑10分です.


10月25日(金)
[13:30-13:40] オープニング

[13:40-14:40] 招待講演
(1) 人間を利用する音声言語処理の試み
高道 慎之介 (東京大学)

音声言語に関する研究では,GPUのような計算資源のみならず,クラウドソー シングのような人的資源も積極的に利用できる.本講演では,人的資源を積極 的に取り入れた音声処理を紹介するとともに,音声研究を支えるツールにも触 れる.

[14:40-15:00] 休憩

[15:00-16:30] 生成・翻訳(3件)
(2) RNN による遷移確率計算を用いた隠れマルコフモデル
○平岡 達也, 高瀬 翔 (東工大), 内海 慶, 欅 惇志 (デンソーアイティーラボ ラトリ), 岡崎 直観 (東工大)

本研究では隠れ状態間の長距離依存をRNNで考慮し,遷移確率の計算を行う隠 れマルコフモデルを提案する.従来のニューラルネットワークを用いた隠れマ ルコフモデルでは,隠れ状態の遷移確率を直前の時刻のみに依存して計算す る.自然言語処理における品詞などの隠れ状態には長距離依存があると考えら れるが,既存の手法ではこれを考慮できているとは言い難い.そこで,RNNを 用いて隠れ状態の系列をエンコードすることにより,隠れ状態の遷移をより的 確に捉えることができると考えられる.一方で,可能な全ての隠れ状態の系列 についてRNNを計算することは現実的ではないため,効率的な計算のための工 夫が必要である.本研究では遷移確率を用いてRNNの隠れベクトルに重み付け を行うことで,隠れ状態の長距離依存を考慮した遷移確率計算が可能な隠れマ ルコフモデルを提案する.提案手法を教師なし品詞タグ付けによって実験・評 価し,その結果と考察を報告する.

(3) 未知語と低頻度語に対応したソースコードにおける関数名の自動生成
○藤田 正悟, 上垣外 英剛 (東工大), 高村 大也 (東工大/産総研), 奥村 学 (東工大)

ソースコード中には低頻度語や,特定の関数にのみ登場する単語が存在する が,既存の関数名の自動生成手法では一定の頻度以上で出現する単語のみを対 象としているため,これらの事例に適切に対処することが難しい.そこで本研 究では,ソースコードにおける関数名の自動生成において,未知語や低頻度語 に対応するための単語の置き換え手法とコピー機構を用いる手法を提案す る.GitHubでstar数上位のリポジトリを用いて作成された89,393件のソース コードデータセットを用いて評価を行った結果,提案手法は従来手法に対しF- 1スコアにおいて1.64の改善を示した.

(4) 漸進的な音声認識・機械翻訳・テキスト音声合成に基づく音声から音声へ の同時翻訳
Novitasari Sashi, 帖佐 克己, 柳田 智也, 二又 航介, 須藤 克仁, Sakriani Sakti, 中村 哲 (奈良先端大)

講演等の同時通訳に代表されるような漸進的な翻訳処理は,遅延の少ない音声 コミュニケーションの実現のために有益である. 音声から音声への自動翻訳 が盛んになってきているが,その多くは1文単位の逐次的な処理に基づくもの であり, 音声認識,機械翻訳,音声合成の各段階で1文単位の入力が揃うまで の遅延が発生し,全体として大きな遅延を生むことになる. 我々は,3つの各 モジュールがそれぞれ漸進的な処理を行い,少ない遅延で後段のモジュールに 結果を受け渡すことで 漸進的な音声から音声への自動翻訳を実現するシステ ムの開発を行っている. 本稿では,漸進的処理を行う音声言語処理の要素技 術とそれらを統合した試作システムと今後の展望について述べる.

[18:00-] 懇親会


10月26日(土)

[10:30-11:30]
(5) ~医療・ソーシャルコンピューティング・地理情報~ 応用指向の情報処理技術
若宮 翔子 (奈良先端大)

本講演では,ソーシャルメディアなどのWeb 上のビッグデータ,電子カルテな どの医療ビッグデータ,スマートデバイスに蓄積されたコミュニケーション データなどの様々なデータに,言語処理技術をはじめとする情報処理技術を応 用することで実現する新しい健康や医療サービスについて紹介します.代表的 なソーシャルメディアであるTwitter(ツイッター)を用いた疾病・健康情報 のサーベイランスや予測について,インフルエンザなどの感染症を題材にした 研究を中心に説明します.また,データの可視化,研究室で公開しているアプ リケーションやコーパスについても言及します.

[11:30-13:00] 昼休み

[13:00-14:00] 言語処理応用(2件)
(6) Web 議論における BERTを用いた 関連情報推薦手法の試作
○内藤 勝太, 白松 俊 (名古屋工大)

多様な参加者によるWeb議論では,相互理解や合意形成を中立の立場でサポー トするファシリテータが重要である.このようなWeb議論では,議論を行う上 で必要な背景知識を持っていない参加者が発言しにくい場面が想定されるた め,議論背景の理解促進につながる情報が議論進行に役立つのではないかと考 える.本研究では,WEB上のテキストから議論に関連した情報を抽出する手法 を試作した.まず,実際にWeb上で行われた議論にIBIS構造をアノテーション し,関係があるとされた文のペアを訓練データとしてBERTで分類器を構成し た.扱った関係の種類は,Idea-Merit, Idea-Demeritなどの5種類である.Web 議論の投稿内容に関連するWebページを検索・収集し,そのテキスト中でBERT 出力スコアの高いものを関連情報として提示する評価実験を行った.その結 果,扱った5種類の関連情報でSolutionとExampleついては比較的高い評価を得 たが、Demeritについては適切な情報提示が難しいという知見を得た.

(7) 契約書のOCR漢字誤り訂正における偏旁冠脚を考慮した編集距離の検討
○阪本 浩太郎 (横国大), 阿部川 明優, 岸川  至白 (Genial Technology, Inc.), 阪本 エリーザ (無所属), 石下 円香, 渋木 英潔 (NII), 森 辰則 (横 国大)

会計業務の効率化を目的として,紙の契約書のスキャンデータから情報を自動 抽出するシステムが求められている.我々は,契約書の構造により,会社名, 住所,氏名などが書かれている範囲を推定し,推定された範囲ごとにOCRの結 果からテキストを抽出するシステムを開発しているが,抽出されたテキストに OCRに起因する文字誤りが発生し,漢字の偏旁冠脚の誤りが観察された.誤り が検出されたテキストを自動訂正するため,本稿では,偏旁冠脚を考慮した編 集距離を用いて辞書に登録されている語に訂正する手法を提案する.また,一 般的な編集距離と比較した結果を報告する.

[14:00-14:15] 休憩

[14:15-15:15] 招待講演
(8) ウェブデータの収集と学術情報分析
吉田 光男 (豊橋技科大)

自然言語処理の応用先の一つとして,ウェブのデータを対象としたウェブマイ ニングがあげられます。 本講演では,ウェブマイニングを行なうに当たって 欠かすことのできないウェブからのデータ収集について,技術的側面と法的側面の双方の解説を行ないます。 さらに,収集したデータを活用した分析事例 として,学術研究の社会的影響を測定するオルトメトリクスについて紹介します。

[15:15-15:30] クロージング

発表募集のご案内

  ★★★★★★★★★★★★★★★ 原稿締切厳守 ! ★★★★★★★★★★★★★★★★
・原稿締切日の24時を過ぎるとシステムに投稿が出来なくなり、
  発表も取り消しとなりますのでご注意ください。
・原稿締切までは 何度でもご自身でアップロード可能 です。
  (締切後は、原稿の差替え(再アップロード)、発表の取り消しもできませんのでご注意ください。)
・フォントが正しく埋め込まれていないといったトラブルもありますので、
  早めに一度アップロードされることをお勧めします。
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★

情報処理学会 第242回自然言語処理研究会 発表募集
https://nl-ipsj.or.jp

●日程: 2019年10月25日(金),26日(土)

●会場: 奈良先端科学技術大学院大学 情報科学棟 L2講義室
(〒630-0192 奈良県生駒市高山町8916−5)
http://www.naist.jp/accessmap/

●発表申込締切: 2019年10月1日(火)23:59まで
●原稿締切: 2019年10月2日(水) 23:59まで ※厳守

●原稿ページ数:2ページ以上
電子化にともないページ数に上限はありません.
※ただし20ページを越える場合は事前にご連絡ください.

●発表時間予定: 一般講演形式 1件30分 (発表20分、質疑10分)

※ 発表時間の調整について
従来の一般講演形式(発表20分,質疑10分)に加えてショート形式(発表10分,
質疑10分),討議形式(発表10分,質疑討論20分)など,発表者からの要望
に応じて発表の合計時間を調整します.アイデアレベルの研究
の紹介や,研究の詳細まで話したいので時間がほしい,などの要求を発表
申込の備考欄にご記入いただければ,それらを考慮してプログラムを作成
します.ぜひご活用ください.

●優秀研究賞
研究会に投稿された予稿の中から特に優れたものを優秀研究賞として表彰
する予定です.

●若手奨励賞
筆頭著者で発表をした方が下記の基準を満たしている発表者に対して,研究会参加者による投票とします.
選考基準: その年の年度頭に30歳未満または(社会人博士も含む)学生に対して,5〜10発表に1件を目処として授与する予定です.

●発表申込先: 下記専用サイトよりお申込みください.
https://ipsj1.i-product.biz/ipsjsig/NL/
(研究会ホームページからもアクセスできます)

●問い合わせ先:
進藤裕之(奈良先端科学技術大学院大学)
E-mail: shindo (at) is.naist.jp

●今後の予定
第243回研究会 2019年12月予定

★研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行い
ません.また,特許出願の公知日(研究報告の公開日)が従来より1週間
早まりますので,ご留意ください.

※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.

情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).

★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
http://www.ipsj.or.jp/kenkyukai/toroku.html

★受け付けは先着順で行なっております
多数のお申し込みを頂いた場合,次回の研究会にまわって頂くよう
お願いする場合があります.なるべく早めにお申し込み下さい.

★締め切り後の発表キャンセルは原則としてできません
発表申し込み後にキャンセルの必要が生じた場合は,至急ご連絡ください.
発表申込後,原稿提出締め切りまでに原稿が到着しない場合には,幹事団の
判断により発表を取り消しさせていただくこともあります.

★論文提出締切後の原稿差し替えはできません
論文提出締切後は,訂正版のアップロードやウェブ上での配布などの原稿
差し替えは一切できませんので,予めご留意ください.
※正誤表の掲載が可能な場合がありますのでご相談ください.

★研究会幹事団
主査:
関根聡  (理化学研究所)
幹事:
木村泰知 (小樽商科大学)
笹野遼平 (名古屋大学)
進藤裕之 (奈良先端科学技術大学院大学)
中澤敏明 (東京大学)
西川仁  (東京工業大学)
桝井文人 (北見工業大学)
横野光  (株式会社富士通研究所)
運営委員:
内海慶  (株式会社デンソーアイティーラボラトリ)
内田ゆず (北海学園大学)
江原遥  (静岡理工科大学)
大内啓樹 (理化学研究所/東北大学)
亀甲博貴 (京都大学)
小林暁雄 (理化学研究所)
斉藤いつみ(日本電信電話株式会社)
佐々木稔 (茨城大学)
貞光九月 (フューチャー株式会社)
佐藤敏紀 (LINE株式会社)
須藤克仁 (奈良先端科学技術大学院大学)
土田正明 (株式会社コトバデザイン)
成松宏美 (日本電信電話株式会社)
西田京介 (日本電信電話株式会社)
羽鳥潤  (株式会社 Preferred Networks)
牧野拓哉 (株式会社富士通研究所)
増村亮  (日本電信電話株式会社)
馬緤美穂 (ヤフー株式会社)
松林優一郎(東北大学)
三輪誠  (豊田工業大学)
森田一  (株式会社富士通研究所)
谷中瞳  (理化学研究所)
吉川克正 (株式会社コトバデザイン)