第228回NL研究発表会

第228回自然言語処理研究発表会

標記の研究発表会はペーパレスで行います(貸し出し用のUSBメモリもご用意しています)。
  • 研究会に登録されている方
    研究報告は開催初日の1週間前(=公知日)に電子図書館当日用サイト(登録会員用)で公開します。

  • 研究会に登録されていない方
    当日受付で資料閲覧用のアカウント情報(URL,ID,PW)をお渡しいたします。
    尚、研究会にご登録いただくことで当研究会のバックナンバーも含めて全て電子図書館でご購読いただけます。登録に関しては 研究会に登録する」のページをご参照ください。

開催案内

情報処理学会 第228回自然言語処理研究会 参加募集
 
============================
 開催概要
 
●日程: 2016年9月29日(木), 30日(金)
 
●会場: 大阪大学吹田キャンパス 銀杏会館(大会議室(会議室D/E))
〒565-0871 大阪府吹田市山田丘2-2
アクセスマップ: https://goo.gl/3WzaEW
(大阪モノレール阪大病院前駅から徒歩7分,
阪急・近鉄バス阪大本部前から徒歩4分)
 
●動画配信URL:
1日目
2日目
 
============================
 懇親会
 
当日は懇親会を予定しておりますので,ぜひご参加ください.
参加申し込み:https://goo.gl/forms/0TBmCDiDFc9BTMdh1
(会場の都合上、9月26日までにお申込み下さい.27日以降のキャンセルは
参加費をいただきますのでご注意ください.)
 
・日時:2016年9月29日(月)18時00分
・会場:サルヴァトーレ クオモ アンド バール(http://www.salvatore.jp/restaurant/senrichuo/
・申込締切:2016年9月26日(月)
・会費:3500円
============================
 照会先
 
荒瀬由紀(大阪大学)
E-mail: arase (at) ist.osaka-u.ac.jp
 
============================
 プログラム(発表件数12件)
 
9月29日(木)14:00-16:50
 [14:00-15:30] 評価と分析      [3件]
 [15:30-15:50] 休憩
 [15:50-16:50] UIとNLP       [2件]
 [18:00-]    懇親会
 
9月30日(金)10:30-16:30
 [10:30-12:00] 基礎解析       [3件]
 [12:00-13:30] 休憩                  
 [13:30-14:30] 招待講演         [1件]
 [14:30-14:45] 休憩
 [14:45-16:15] 深層学習とNLP    [3件]   
 [16:15-16:30] クロージング
 
—————————-
9月29日(木)
 
[14:00-15:30] 評価と分析 [3件]
座長:高村 大也 (東京工業大学)
 
(01)酒井 哲也, Zeng Zhaohao (早稲田大学), Luo Cheng (Tsinghua University/早稲田大学)
Evaluating Helpdesk Dialogues: Initial Considerations from An Information Access Perspective
 
Whenever a user of a commercial product or a service encounters a problem, an effective and efficient way to 
solve it might be to contact the helpdesk. In the present study, we address the problem of evaluating textual 
dialogues between the customer and the helpdesk, such as those that take the form of online chats. Successful 
dialogues are desirable both for the customer and for the company that sells the product/service. We are planning 
to build a Chinese helpdesk dialogue test collection (with English translations) and a suite of language-independent 
evaluation measures for quantifying the success of each dialogue. Establishing reliable automatic evaluation measures 
for helpdesk dialogues should enable researchers and engineers to build and tune intelligent helpdesk software. 
This paper reports on our initial step towards this direction to seek feedback from the natural language processing 
research community in Japan.
 
(02)深澤 祐援 (株式会社クックパッド/東京大学), 原島 純 (株式会社クックパッド)
料理レシピサービスにおける検索語の意味変化に関する分析
 
我々の毎日の食事について, その傾向を分析するためにこれまで様々な研究が行われてきている. こうした研究の多くは
アンケートやインタビューによる分析を行っている. これに対して, 本研究では料理レシピサービスであるクックパッド内
に蓄積された検索ログによる分析を行なった. 具体的には, 検索ログの共起語ネットワークに対する表現学習によって各語に
関する分散表現を獲得し, 2015年9月を起点としてどれだけの意味変化が生じているのかを分析した. 分析の結果, 味覚表現
に関する単語が最も意味変化が大きく, 加工食品に関する検索語の意味変化が最も小さいことなどがわかった. 
 
(03)佐藤 貴之 (首都大学東京/クックパッド株式会社), 原島 純 (クックパッド株式会社), 小町 守 (首都大学東京)
レシピに対する日英機械翻訳の誤り分析
 
インターネット上で取得可能なレシピが増加するにつれ,レシピの解析や検索,要約,推薦など,レシピを対象とした
研究も増加している.レシピを対象とした様々な研究がある中,これまでに研究されていないトピックとして機械翻訳がある.
食文化の多様化とともにレシピの需要も国際的に拡大しており,機械翻訳はその需要に応える手段の一つであると考えられる.
そこで,本研究ではレシピの機械翻訳に取り組み,その誤りを分析した.具体的には,多くのレシピを抱えるクックパッドの
日本語のレシピを,多くの使用者がいる英語に翻訳することを試みた.そして,翻訳結果における誤りを分類・分析し,それら
の誤りにどのように対処すべきかを検討した.
 
[15:30-15:50] 休憩
 
[15:50-16:50] UIとNLP [2件]
座長:荒瀬 由紀(大阪大学)
 
(04)松山 宏樹 (秀明大学), 岡田 勇 (創価大学), 宮﨑 瑞之 (秀明大学), L.Miyazaki Dawn (早稲田大学), 横山 晶一 (山形大学),
 江原 暉将 (江原自然言語処理研究室), 宮澤 信一郎 (秀明大学)
ウェブページ・インターフェース翻訳の技術課題
 
機械翻訳技術の向上に伴い、よりシームレスな自動翻訳システムに対するニーズが高まってきた。異なる言語を用いても
スムーズにコミュニケーションするためには機械翻訳技術だけでなく、コミュニケーションを行う主体間のインターフェース
にも適切な翻訳技術が用いられる必要がある。しかし、このようなインターフェース翻訳はこれまであまり注目されていない。
我々はウェブページ・インターフェースを取り上げ、克服すべき技術課題の探索を行った。そのためウェブページで標準的に
使用されている文法を中心に検討し、標準テスト項目を策定した。これを用いて商業的に機械翻訳を提供している主要9つのサイト
に対し人手評価を行った。この結果、技術的課題を5カテゴリに集約させることができた。ウェブページ・インターフェース
翻訳の主たる技術課題としては、異なるフォーマットとして記録されているデータの中に埋め込まれた文字情報の復元化が挙げられ、
また技術的に可能な属性についてサイト別に評価し、翻訳再現率といった指標を提示することが有効であることが分かった。
 
(05)小池 誠 (小池誠マイクロ波研究所)
音声対話システムの斬新な出力インタフェース
 
音声対話システムの出力インタフェースとしては、通常、スピーカーから音声が出力される。本稿は、音声対話システムの
出力インタフェースとして、マイクロ波聴覚刺激を応用した無線通信が音声を伝える方式を提案する。この無線通信は、基本的には、
音声信号により振幅変調した後、更にパルス変調するものである。マイクロ波聴覚刺激により頭部が復調器として機能し、頭の中から
声が聞こえるという状態を誘発することができる。
 
9月30日(金)
[10:30-12:00] 基礎解析 [3件]
座長:原島 純 (株式会社クックパッド)
 
(06)寺内 賢志, 佐々木 稔, 古宮 嘉那子, 新納 浩幸 (茨城大学)
擬似用例を追加する能動学習を用いた一般単語の語義曖昧性解消
 
語義曖昧性解消において、教師あり学習に用いる訓練データすべてに人手でラベルを付けていくためには膨大なコストがかかる。
そのため、能動学習によってコストを削減する研究が行われている。先行研究では、分類器により負例と判定されたデータのみを
訓練データとして追加する能動学習を用いて、固有名詞を対象とした語義曖昧性解消を行っている。先行手法は固有名詞に対しては
良い結果が得られるが、一般単語に対して識別精度が低いという問題点がある。そこで本論文では、一般単語に対する語義曖昧性
解消のための能動学習手法を提案する。提案手法では、分類器により負例と判定されたデータのみでなく、正例と判定されたデータも
訓練データとして追加する能動学習を用いて語義曖昧性解消を行う。提案手法での実験を行った結果、既存手法に比べ一般単語に
対する識別精度が向上した。
 
(07)鈴木 雅也, 古宮 嘉那子 (茨城大学), 岩倉 友哉 (富士通研究所), 佐々木 稔, 新納 浩幸 (茨城大学)
固有表現抽出におけるアノテーション手法の比較
 
本稿では,非専門家による固有表現抽出のタスクとしてのアノテーションを題材に,次の2つのアノテーション手法について比較を行った.
1つ目は,既存の固有表現抽出器によるアノテーション結果に対し,人手で修正を行う手法である.2つ目は,既存の固有表現抽出器を
使用せず,人手でアノテーションを行う手法である.実験では,1テキストに対し,2人のアノテータを割り当て,それぞれの手法で
アノテーションを行わせた.そして,アノテーションにかかる時間,タグの一致率,及び,Gold Standardとの比較による正解率の各指標について,
平均値とどちらか一方でも正解のタグを付与しているならば正解とみなした場合の数値を算出した.本実験の結果から,全体的に見たとき,
既存のアノテーション結果を用いた手法は,アノテーションにかかる時間が少なく,一致率や正解率についても高い値になることがわかった.
しかし,訓練事例から離れたジャンルのテキストについては,既存の固有表現抽出器を用いない手法の方が良い結果を出しており,このような
テキストについては,既存の固有表現抽出器を用いず,人手のみでアノテーションを行った方が良いと考えられる.
 
(08)尾崎 竜史, 一杉 裕志 (産業技術総合研究所)
範疇文法の構文解析についての圏論的な視点
 
双閉モノイド圏(biclosed monoidal category) を紹介し,これが古典的な範疇文法のモデルとなることを説明する.また,このモデルでは
古典的な範疇文法においてad hoc に導入されていた文法範疇の同値性ルールの一つが自然同値として構成されることを示す.また,単一の
文に対して同じ意味を与えるような二通りの構文解析が可能な現象を,双閉モノイド圏における図式の可換性として捉えることを提案する.
最後に,組み合わせ範疇文法への拡張を簡単に検討する.
 
[12:00-13:30] 休憩
 
[13:30-14:30] 招待講演
座長:荒瀬 由紀(大阪大学)
 
(09)中野 珠実 (大阪大学大学院生命機能研究科)
瞬きから探る脳の情報分節化機構
 
我々ヒトはおよそ3秒に1回の割合で瞬きをしている。眼球湿潤のためには20秒に1回ほどで十分なことから、何のために頻回に瞬きをしているのか、
長年の謎であった。映像観察時に瞬きをしているタイミングを調べたところ、人々の瞬きが、映像の非明示的な情報の切れ目で同期して生じている
ことが明らかとなった。さらに、この瞬きに伴い、脳の中では、内的な処理に関わるデフォルト・モード・ネットワークの活動が一過性に上昇し、
同時に外界へ注意を向ける注意制御の神経ネットワークの活動が低下していた。つまり、瞬きは、拮抗する神経ネットワークの活動を一過性に
スイッチすることで、情報を分節化して脳内に取り込んでいると考えられる。
では、瞬きを介して情報の分節を人々は共有することができるのだろうか。そこで、対面会話時に、話者の瞬きに対して、聞き手の瞬きが同期して
発生するかを調べた。すると、話の切れ目で生じた話者の瞬きに対し、聞き手の瞬きが同期して発生していた。このような話の切れ目での瞬きの同期は、
コミュニケーションの障害が主症状の自閉症スペクトラム障害では生じなかった。つまり、対面会話時の瞬き同期は、情報の分節を無意識に二者間
で共有できているかを客観的に表しており、この情報の分節の共有化が円滑なコミュニケーションには重要であることがわかる。
 
[14:30-14:45] 休憩
 
[14:45-16:15] 深層学習とNLP[3件]
座長:中澤 敏明 (科学技術振興機構) 
 
(10)加藤 玲大, 馬 青 (龍谷大学), 村田 真樹 (鳥取大学)
深層学習を用いたQAサイト質問文のカテゴリ分類
 
本稿は,深層学習の手法であるDeep Belief Network (DBN),Stacked Denoising Autoencoder (SdA)を用いて,QAサイトに投稿された
質問文のカテゴリ分類について述べる.カテゴリ分類におけるDBNとSdAの有効性を確認するため,多層パーセプトロン(MLP),サポート
ベクターマシン(SVM)をベースライン手法とし,分類精度の比較を行った.次元数の異なる入力データを2種類用意し,入力の次元数の
違いにおける分類精度の比較を行った.機械学習手法のパラメータの最適化にはグリッドサーチを行うことにより決定した.実験の結果,
SdAが最も精度が高かった.また,入力が高次元の時,DBN,SdAともに分類精度がベースライン手法より高かった.さらに,入力の次元数
を増やすことが深層学習の精度の向上に有効であることが確認できた.
 
(11)池田 大志, 進藤 裕之, 松本 裕治 (奈良先端科学技術大学院大学)
Encoder-Decoderモデルを用いた日本語崩れ表記の正規化
 
近年,ソーシャルメディアの普及に伴い,ウェブ上には人々が投稿した膨大な量のテキストデータが存在するようになった.それに伴い,
評価極性分析や話題抽出などの需要が高まり,ウェブ上のテキストデータは重要な言語資源であると考えられている.しかし,新聞記事
データを用いて訓練した形態素解析器では,口語表現や表記揺れなどを多く含むウェブ上のテキストに対して,形態素解析誤りを起こす
問題がある.そのため,崩れ表記を含む文を正規化することで,形態素解析誤りを削減することができると考えられる.本研究では,
ニューラルネットワークに基づくEncoder-decoderモデルを用いた日本語崩れ表記の正規化手法を提案する.また,擬似崩れ表記データ
を用いて正規化に適用した実験結果についても報告する.
 
(12)佐藤 貴俊, 高村 大也, 奥村 学 (東京工業大学)
分散表現を用いた単語の感情極性抽出
 
単語の感情極性抽出における分散表現の有効な利用方法を検証する。提案手法では、単語の分散表現を使って分類器を学習することで、
約90%の正解率で単語の感情極性を判定することができた。学習した分類器は、分散表現を有するあらゆる単語に適用可能であり、
Wikipedia中のすべての単語に対して感情極性を付与することで、既存のものと比較して非常に大規模な単語の感情極性リストを構築した。
 
[16:15-16:30] クロージング
 
—————————-
 
※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.
 
情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
当日閲覧用サイト
 
※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).
★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
 
============================
 研究会幹事団
 主査:
   乾健太郎 (東北大学)
 幹事:
   荒瀬由紀 (大阪大学)
   岡崎直観 (東北大学)
   木村俊也 (株式会社ミクシィ)
   小町守  (首都大学東京)
   西川仁  (東京工業大学)
 運営委員:
   浅原正幸 (国立国語研究所)
   荒牧英治 (奈良先端科学技術大学院大学)
   石野亜耶 (広島経済大学)
   金丸敏幸 (京都大学)
   小林隼人 (Yahoo! JAPAN 研究所)
   古宮嘉那子(茨城大学)
   貞光九月 (日本電信電話株式会社)
   佐藤敏紀 (LINE株式会社)
   新里圭司 (株式会社楽天)
   鈴木祥子 (日本アイ・ビー・エム株式会社)
   数原良彦 (リクルートホールディングス)
   高村大也 (東京工業大学)
   土田正明 (日本電気株式会社)
   堂坂浩二 (秋田県立大学)
   徳永拓之 (スマートニュース株式会社)
   二宮崇  (愛媛大学)
   橋本力  (独立行政法人 情報通信機構)
   藤田早苗 (日本電信電話株式会社)
   牧野貴樹 (グーグル株式会社)
   牧野拓哉 (株式会社富士通研究所)
   松崎拓也 (名古屋大学)
   ミハウ・プタシンスキ(北見工業大学)
   村脇有吾 (京都大学)
   若木裕美 (株式会社東芝)
   Kevin Duh (Johns Hopkins University)

発表募集

 情報処理学会 第228回自然言語処理研究会 発表募集
https://nl-ipsj.or.jp

●日程: 2016年9月29日(木), 30日(金)

●会場: 大阪大学吹田キャンパス 銀杏会館(大会議室(会議室D/E))
〒565-0871 大阪府吹田市山田丘2-2
http://www.office.med.osaka-u.ac.jp/icho/icho-jp.html
アクセスマップ: https://goo.gl/3WzaEW
(大阪モノレール阪大病院前駅から徒歩7分,
阪急・近鉄バス阪大本部前から徒歩4分)

●発表申込締切: 2016年8月26日(金) ※延長しました。

●原稿締切: 2016年9月5日(月) ※厳守

●原稿ページ数:2ページ以上
電子化にともないページ数に上限はありません.
※ただし20ページを越える場合は事前にご連絡ください.

●発表時間予定: 一般講演形式 1件30分 (発表20分、質疑10分)

※ 発表時間の調整について
従来の一般講演形式(発表20分,質疑10分)に加えてショート形式(発表10分,
質疑10分),討議形式(発表10分,質疑討論20分)など,発表者からの要望
に応じて発表の合計時間を調整します.アイデアレベルの研究
の紹介や,研究の詳細まで話したいので時間がほしい,などの要求を発表
申込の備考欄にご記入いただければ,それらを考慮してプログラムを作成
します.ぜひご活用ください.

●優秀研究賞
研究会に投稿された予稿の中から特に優れたものを優秀研究賞として表彰
する予定です.

●発表申込先: 下記専用サイトよりお申込みください.
https://ipsj1.i-product.biz/ipsjsig/NL/
(研究会ホームページからもアクセスできます)

●動画中継
今回の研究会では,インターネットを利用した研究発表の動画中継を予定
しております.基本的にすべての発表を動画中継の対象とする予定ですが,
発表者の希望により対象から外すことも出来ますので,研究発表の当日に
その旨お伝えください.動画中継の詳細については,追ってアナウンス
いたします.

●問い合わせ先:
荒瀬由紀(大阪大学)
E-mail: arase (at) ist.osaka-u.ac.jp

●今後の予定
第229回研究会(第3回自然言語処理シンポジウムと共催) 2016年12月21(水)22日
(木),首都圏(予定)
第230回研究会 2017年5月予定
※2017年1月には開催されません。

★研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行い
ません.また,特許出願の公知日(研究報告の公開日)が従来より1週間
早まりますので,ご留意ください.

※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.

情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).

★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
http://www.ipsj.or.jp/kenkyukai/toroku.html

★受け付けは先着順で行なっております
多数のお申し込みを頂いた場合,次回の研究会にまわって頂くよう
お願いする場合があります.なるべく早めにお申し込み下さい.

★締め切り後の発表キャンセルは原則としてできません
発表申し込み後にキャンセルの必要が生じた場合は,至急ご連絡ください.
発表申込後,原稿提出締め切りまでに原稿が到着しない場合には,幹事団の
判断により発表を取り消しさせていただくこともあります.

★論文提出締切後の原稿差し替えはできません
論文提出締切後は,訂正版のアップロードやウェブ上での配布などの原稿
差し替えは一切できませんので,予めご留意ください.
※正誤表の掲載が可能な場合がありますのでご相談ください.

★研究会幹事団
主査:
乾健太郎 (東北大学)
幹事:
荒瀬由紀 (大阪大学)
岡崎直観 (東北大学)
木村俊也 (株式会社ミクシィ)
小町守  (首都大学東京)
西川仁  (東京工業大学)
運営委員:
浅原正幸 (国立国語研究所)
荒牧英治 (奈良先端科学技術大学院大学)
石野亜耶 (広島経済大学)
金丸敏幸 (京都大学)
小林隼人 (Yahoo! JAPAN 研究所)
古宮嘉那子(茨城大学)
貞光九月 (日本電信電話株式会社)
佐藤敏紀 (LINE株式会社)
新里圭司 (株式会社楽天)
鈴木祥子 (日本アイ・ビー・エム株式会社)
数原良彦 (リクルートホールディングス)
高村大也 (東京工業大学)
土田正明 (日本電気株式会社)
堂坂浩二 (秋田県立大学)
徳永拓之 (スマートニュース株式会社)
二宮崇  (愛媛大学)
橋本力  (独立行政法人 情報通信機構)
藤田早苗 (日本電信電話株式会社)
牧野貴樹 (グーグル株式会社)
牧野拓哉 (株式会社富士通研究所)
松崎拓也 (名古屋大学)
ミハウ・プタシンスキ(北見工業大学)
村脇有吾 (京都大学)
若木裕美 (株式会社東芝)
Kevin Duh (Johns Hopkins University)