第217回NL研究発表会

第217回自然言語処理研究発表会

標記の研究発表会はペーパレスで行います(貸し出し用のUSBメモリもご用意しています)。
  • 研究会に登録されている方
    研究報告は開催初日の1週間前(=公知日)に電子図書館当日用サイト(登録会員用)で公開します。

  • 研究会に登録されていない方
    当日受付で資料閲覧用のアカウント情報(URL,ID,PW)をお渡しいたします。
    尚、研究会にご登録いただくことで当研究会のバックナンバーも含めて全て電子図書館でご購読いただけます。登録に関しては 研究会に登録する」のページをご参照ください。

プログラム

----------------------------------------------------------------------
情報処理学会 第217回自然言語処理研究会
----------------------------------------------------------------------

◎ 日程: 2014年7月3日(木)・4日(金)

◎ 会場: オホーツク・文化交流センター(エコーセンター2000) 視聴覚室

◎ 交通アクセス: 女満別空港より連絡バスで約30分,JR網走駅より徒歩11分

◎ ホームページ
http://www.city.abashiri.hokkaido.jp/040shisetsu/040bunka/180echocenter/

◎ 照会先:
* 研究会・会場に関する問い合わせ先:
岡崎 直観 (東北大学)
E-mail: okazaki (at) ecei.tohoku.ac.jp

======================================================================
プログラム(発表件数16件)

7月3日(木) 14:10~17:50
[14:10~15:30] 構文解析・構造解析       [3件(ショート発表1件)]
[15:50~16:50] 機械翻訳・生成           [2件]
[16:50~17:50] ACL2014参加報告          [2件]

7月4日(金) 10:00~17:30
[10:00~11:30] 知識獲得・推論           [3件]
[13:00~14:00] 招待講演                 [1件]
[14:00~14:30] クラウドソーシング       [1件]
[15:00~17:30] 語彙・曖昧性解消         [4件]

※都合により,7/3の3番の発表と7/4の16番の発表を入れ替えました

======================================================================

7月3日(木) 14:10~17:50
■ 14:10~15:30 構文解析・構造解析 (3件) ■
座長: 河原 大輔(京都大学)

( 1) シソーラスを用いた日本語倒置文に対応した語順整序 [ショート発表(20分)]
    佐藤 崇史 (創価大学大学院 工学研究科),今村 弘樹 (創価大学 工学部)

    日本語は語順が比較的自由であり,同意な文でも話者によって語順や言い回し
    が様々である.それらの文をコンピュータに同意な文として処理させるに,ま
    ずは文を統一された語順に並べ替える必要がある.特に,倒置文の様な日本語
    の標準的な語順以外の文章はそのままでは文の主語・述語等が識別する事が困
    難であるため, 語順を並べ替える必要がある.そこで,本手法では倒置文の様な
    語順の文章にも対応する手法を提案する.本稿ではシソーラスにある述語の
    文章パターンのデータを用いて,入力された文の語順を整序する手法を提案
    する.提案手法では入力文に対して係り受け解析を行い,解析結果から入力文
    が倒置文であると判断できれば非倒置文に変換する.その後,シソーラスのデ
    ータに沿って語順整序を行う.

( 2) 単一述語項関係アノテーション課題における視線情報の収集と分析
    光田 航,飯田 龍,徳永 健伸 (東京工業大学 大学院情報理工学研究科)

    テキストアノテーション時の作業者の振舞いは,作業者が文章を理解する認知
    的な処理を反映していると考えられる.したがって,この振舞いを分析し,ア
    ノテーション過程で作業者がどのような点に着目しているかを明らかにするこ
    とで,深い言語処理やコーパス構築に役立つ知見を獲得できると考えられる.
    我々はこれまでに日本語述語項構造アノテーション時の作業者のアノテーショ
    ンの履歴と視線情報を収集したが,この際に採用したデータ収集の方法では,
    1つの文章全体を単位としてデータ収集を行ったため,個別の述語項関係につ
    いての分析が困難になるという問題が発生した.そこで,本研究では,新たに
    文章中に出現する単一の述語とその項の対を単位としてアノテーションする際
    の作業者の振舞いを収集することで,データ分析を容易にする.本稿では,こ
    のデータ収集の方法とその収集結果,また収集したデータに基づく予備的な分
    析結果について報告する.

(16) 特許抄録に出現する多字種複合語を対象とした字種変化特性の分析
    熊澤 侑美 (神奈川大学大学院理学研究科),後藤 智範 (神奈川大学理学部情報科学科)

    近年,理工学分野の学術論文,特許などの文書に用いられる用語は,複数の字
    種で表記される複合語が多くみられる.研究開発が増加するにつれ,複数字種
    表記の用語はますます増加する傾向にある.この傾向はこれらの分野の専門用
    語について特に顕著である。本研究では、コーパスとして特許抄録から抽出し
    た約13万語の複数字種表記された用語を対象に、NL-204で報告した調査を発展
    させ、以下の項目について、分析・考察した。(a)字種変化数・字種変化パター
    ン(字種記号列長)数・用語出現頻度 (b) 特定先頭字種毎の字種変化数・字種
    変化パターン(字種記号列長)数・用語出現頻度 (c)字種変化単位と構成単語単
    位との関連

■ 15:50~16:50 機械翻訳・生成 (2件) ■
座長: 飯田 龍(東京工業大学)

( 4) 物語生成における形式と内容—統合物語生成システムの実装の観点から—
    小方 孝 (岩手県立大学)

    物語生成を形式的機構と内容的機構の観点から考察する.内容的機構とは具体
    的な概念や言語等の辞書,一種の事例としての物語のコンテンツ等の知識内容
    を意味し,形式的機構とはそれらを使用して物語を生成するための機構を意味
    する.物語生成システムの研究は近年かなりさかんになっているが,本発表で
    はこの二つの軸からその共通的な要件を考察する.議論の具体化のために,筆
    者らのグループが現在開発を進めている統合物語生成システムを題材とする.

( 5) 統語ベース翻訳に対する統語的前処理の適用
    波多腰 優斗,ニュービッグ グラム,サクティ サクリアニ,戸田 智基,
中村 哲 (奈良先端科学技術大学院大学)

    フレーズベース翻訳において,翻訳精度を向上させるために統語情報を用いた
    様々な前処理の手法が提案されている.例えば英日翻訳において,英語を日本
    語の語順に近づける並べ替え処理や,日本語の助詞に相当する擬似単語を挿入
    する処理を行うHead Finalizationは,フレーズベース翻訳の精度を大幅に改
    善することが知られている.このような統語的前処理が精度の向上に貢献する
    理由として,フレーズベース翻訳の並べ替えモデルの貧弱さと事前並べ替えに
    よる改善が挙げられてきた.しかし,アライメント精度の改善や,擬似助詞の
    挿入による翻訳性能改善もHead Finalizationの重要な要素であり,これらの
    効果はフレーズベース翻訳に限ったものではないと考えられる.そこで,本稿
    ではHead Finalizationの各要素がどの程度翻訳精度に貢献しているかを検証し,
    並べ替えの問題が比較的少ない統語ベース翻訳に対しても有効であるか調査を
    行う.実験の結果,統語ベース翻訳に対して統語的前処理を適用することで翻
    訳精度が向上することを確認した.

■ 16:50~17:50 ACL2014参加報告 (2件) ■
座長: 岡崎 直観(東北大学)

( 6) ACL2014参加報告(1)
    小田 悠介 (奈良先端科学技術大学院大学)

    2014年6月下旬にボルチモアで開催される計算言語学の国際会議ACL
    2014の参加報告を行う.

( 7) ACL2014参加報告(2)
    田 然 (東北大学情報科学研究科)

    ACL2014に参加した報告をいたします。

======================================================================

7月4日(金) 10:00~17:30
■ 10:00~11:30 知識獲得・推論 (3件) ■
座長: ニュービッグ グラム(京都大学)

( 8) Word2vecの並列実行時の学習速度の改善
    岡崎 直観,乾 健太郎 (東北大学)

    単語の意味ベクトルを大規模コーパスから学習するためのツールとして,
    Mikolovら (2013) の手法を実装したword2vecが注目を浴びている.本論文は,
    word2vecを複数のプロセッサで並列で動作させた時に学習速度が低下する原因
    を説明し,これを改善するアルゴリズムを提案する.提案手法は学習で得られ
    る単語ベクトルの質を落とすこと無く,複数のプロセッサを効率よく利用でき
    ることを実験的に示す.

( 9) 近似頻度計測手法を用いた大規模データからの関係獲得
    高瀬 翔,岡崎 直観,乾 健太郎 (東北大学)

    大規模なWebデータからエンティティペアやパタンのクラスタリングを通して
    意味関係を発見する関係獲得において,パタンやエンティティペアの間の類似
    度計算をスケーラブルに行う事は非常に重要な問題である.本論文では,近似
    頻度計算による省メモリな素性作成手法と次元圧縮による類似度計算時間の高
    速化を実現する手法を提案する.実験において,近似計算でも精度が落ちない
    事,また,計算時間の高速化の効果を示す.

(10) A*探索に基づく仮説推論の効率化
    山本 風人,井之上 直也,乾 健太郎 (東北大学),
    荒瀬 由紀,辻井 潤一 (Microsoft Research Asia)

    本稿では,一階述語論理上での仮説推論を効率的に行う手法を提案する.仮説
    推論は,観測に対して評価関数が最も大きくなる説明を求める推論であり,自
    然言語処理において文章に明示されていない情報の顕在化を行う際に有用な枠
    組みとして,近年注目されている.しかしその一方で,最適解を求める際にか
    かる計算量が観測や背景知識の規模に対して指数増大するという性質により,
    求解時間が実問題への適用を考える上での大きな問題の一つとなっている.そ
    こで我々は,仮説推論における説明候補の生成を探索問題として捉え,A*探索
    アルゴリズムに基づいた探索を行うことによって,効率的に推論を行うアルゴ
    リズムを提案する.また,提案手法による推論が従来の仮説推論アルゴリズム
    よりも効率的であることを確かめるために,既存のデータセットを用いて実験
    した結果についても報告する.

■ 13:00-14:00 招待講演 (1件) ■
座長: 乾 健太郎(東北大学)

(11) クラウドソーシングにおける統計的品質管理手法の研究動向
    馬場 雪乃 (国立情報学研究所)

    不特定多数の人々に仕事を発注する仕組み「クラウドソーシング」が自然言語
    処理を含む様々な研究分野で広く活用されるようになった。クラウドソーシン
    グの利便性向上を目的とした研究も数多くなされている。本講演では、クラウ
    ドソーシングの最大の課題の一つである品質管理に焦点をあて、特に、複数の
    作業結果を統合することで品質向上を目指す統計的品質管理手法の研究動向を
    紹介する。

■ 14:00-14:30 クラウドソーシング (1件) ■
座長: 乾 健太郎(東北大学)

(12) 2段階のクラウドソーシングによる談話関係タグ付きコーパスの構築
    河原 大輔,町田 雄一郎,柴田 知秀 (京都大学 大学院情報学研究科),
    黒橋 禎夫 (京都大学 大学院情報学研究科 / 独立行政法人科学技術振興機構,CREST),
    小林 隼人,颯々野 学 (ヤフー株式会社)

    本稿では、クラウドソーシングを活用することによって、談話関係タグ付きコ
    ーパスを構築する手法を提案する。談話関係のタグ付けは従来は非常に長い時
    間とコストがかかるものであったが、提案手法ではこれを2段階のクラウドソ
    ーシングのタスクに分けることによって短時間で構築する。日本語を対象とし
    て実験を行い、3万文からなるコーパスが8時間以内で構築できることを示す。
    また、構築したコーパスを利用して談話関係解析器を開発し、コーパスの有用
    性を示す。

■ 15:00~17:30 語彙・曖昧性解消 (4件) ■
座長: 田 然(東北大学)

(13) 話題追跡のための共起ネットワークによる語の重要度の検討
    増田 真也 (日本工業大学大学院),石川 孝 (日本工業大学)

    オンラインニュースなどWeb上で発信される情報の中には互いに時系列的関連
    を持ち,情報ストリームを形成するものが少なくない.話題追跡タスクでは,
    ある特定の話題に関する少数の記事が与えられた場合に,その話題に関する記
    事を情報ストリームから検出する.従来手法では,少数の記事から求めた語の
    重要度を補正するために,大量のコーパスを利用する手法が用いられている.
    一方で,テキスト分類の分野では,文書中の語の共起ネットワークから語の重
    要度を求める手法が提案されている.そこで本研究は,少数の記事だけを用い
    る話題追跡手法の提案を目的として,共起ネットワークによる語の重要度の検
    討を行う.

(14) ソーシャルメディアにおける空間的近接性と時間的一貫性を考慮した地名の曖昧性解消
    粟村 誉,荒牧 英治,河原 大輔,柴田 知秀,黒橋 禎夫 (京都大学)

    近年,膨大な量の文書がWeb上に溢れるようになるにつれ,有用な情報を抽出
    する技術が重要になってきた.特に,Twitterなどのソーシャルネットワーク
    サービス(SNS)は地域固有の情報を含むことが多いため,文書内の地名表現が
    どこの地名、地域を指しているかを同定することが必要となる.これまで,こ
    のような地名曖昧性解消の問題は,語義曖昧性解消の手法に基づき,語彙情報
    に基づいて解かれることが多く,地名特有の手がかりが使われていない.本研
    究では,(1)空間的近接性と(2)時間的一貫性の二つの手がかりを用いて,地名
    曖昧性解消の精度向上を目指す.空間的近接性は,投稿内の地名同士は距離が
    近いことが多いという傾向,時間的一貫性は,一連の投稿に現れる地名はそれ
    ぞれ関連性があるという傾向をとらえるために導入する.位置情報付きツイー
    トを用いた実験によって,二つの手がかりの有効性を確認した.

(15) 複単語表現を考慮した英語文法誤り訂正
    水本 智也,松本 裕治 (奈良先端科学技術大学院大学)

    複単語表現は複数の単語である1つの意味を形成するものである。複単語表現
    を考慮することで、英語文法誤り訂正にどのような効果があるか示す。

( 3) 実文書を自然言語処理技術と適切に繋ぐ技術の重要性
    原 忠義,トピチ ゴラン,宮尾 祐介,相澤 彰子 (国立情報学研究所)

    自然言語処理(NLP)ツールの多くが入力として平文テキストを前提とする
    一方で,実文書中のテキストは多様なレイアウト,文構造,埋め込みのオブ
    ジェクトなどによって,より表現豊かに表示されている.このようなテキスト
    をNLPツールで解析する際には,ツールの利用者が対象テキストをツールに
    合った入力形式に変換しなければならない.また,利用者の不慣れな変換作業
    によって得られた入力を用いたところで,そのツールが本来持つとされる性能
    を発揮することは困難となるであろう.本研究の目的は,平文テキストでは表
    し切れないテキスト構成がタグを用いて表現されるようなXML文書の解析を題
    材として,この問題への意識喚起を促すことにある.我々は, XMLでタグ付け
    されたテキストと,NLPツールの入出力となる平文テキストとの間の一般的な
    変換枠組を提案し,本枠組を用いて獲得されるテキスト列が,単純にタグを除
    去して得られるテキストよりも構文解析器で高被覆かつ高効率に処理できるこ
    とを示し,実文書をNLP技術と適切に繋ぐ技術を開発することの重要性を浮き
    彫りにする.

(17) 総合討論・クロージング

======================================================================

★ 研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行い
ません.また,特許出願の公知日(研究報告の公開日)が従来より1週間
早まりますので,ご留意ください.

※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.

情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)

当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).

 

発表募集

----------------------------------------------------------------------
情報処理学会 第217回自然言語処理研究会 発表募集
http://www.nl-ipsj.or.jp/
----------------------------------------------------------------------

●日程: 2014年7月3日(木)・4日(金)
●会場: オホーツク・文化交流センター(エコーセンター2000) 視聴覚室
        http://www.city.abashiri.hokkaido.jp/040shisetsu/040bunka/180echocenter/
●交通アクセス: 女満別空港より連絡バスで約30分,JR網走駅より徒歩11分

●発表申込締切: 2014年5月27日(火)
●原稿締切:     2014年6月10日(火) ※厳守
●原稿ページ数: 1ページ~
         電子化に伴いページ数に制限はありません.
         ただし,20ページを越える場合は事前にご連絡ください.
●発表時間予定: 1件につき30分(発表20分,質疑10分)
 ※発表時間の調整について
 従来の一般形式(発表20分,質疑10分)に加えてショート形式(発表10分,
 質疑10分),討議形式(発表10分,質疑討論20分)など,発表者からの
 要望に応じて発表の合計時間を調整したいと思います.アイデアレベルの
 研究の紹介や,研究の詳細まで話したいので時間が欲しい,等のご要望を
 発表申込の備考欄にご記入いただければ,それらを考慮してプログラムを
 編成したいと思います.ぜひご活用ください.

●発表申込先: 下記専用サイトよりお申込みください.
 https://ipsj1.i-product.biz/ipsjsig/NL/
 (研究会ホームページからもアクセスできます)

●動画中継
 今回の研究会では,インターネットを利用した研究発表の動画中継を試行
 する予定です.基本的にすべての発表を動画中継の対象とする予定ですが,
 発表者の希望により対象から外すことも出来ますので,研究発表の当日に
 その旨お伝えください.動画中継の詳細については,追ってアナウンス
 いたします.

●研究会・会場に関する問い合わせ先:
 岡崎 直観(東北大学) < okazaki (at) ecei.tohoku.ac.jp >

●今後の予定
 第216回 2014年5月23-24日
     東京工業大学 大岡山キャンパス
 第217回 2014年7月3-4日
     網走市 オホーツク文化交流センター
     申込締切: 5月27日,原稿締切: 6月10日
 第218回 2014年9月
 第219回 2014年12月17-18日 または 16-17日(仮)
     東京工業大学 すずかけ台キャンパス
     NLC研と合同シンポジウムの開催を計画中
 第220回 2015年1月

★研究報告のペーパーレス化
 本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行い
 ません.また,特許出願の公知日(研究報告の公開日)が従来より1週間
 早まりますので,ご留意ください.

 ※自然言語処理研究会に登録されている方
 研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
 します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
 PCにダウンロードのうえ,ご持参ください.

 情報処理学会電子図書館(情報学広場)
 https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
 当日閲覧用サイト
 http://www.ipsj.or.jp/sig-reports/

 ※自然言語処理研究会に登録されていない方
 当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
 当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
 本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
 登録されていない方は,是非この機会に研究会に登録してください
 (登録まで最大3日かかりますのでご留意ください).

★研究会への登録をお勧めします
 年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
 お得になります.研究会登録は以下のウェブサイトから行えます.
 http://www.ipsj.or.jp/kenkyukai/toroku.html

★受け付けは先着順で行なっております
 多数のお申し込みを頂いた場合,次回の研究会にまわって頂くよう
 お願いする場合があります.なるべく早めにお申し込み下さい.

★締め切り後の発表キャンセルは原則としてできません
 発表申し込み後にキャンセルの必要が生じた場合は,至急ご連絡ください.
 発表申込後,原稿提出締め切りまでに原稿が到着しない場合には,幹事団の
 判断により発表を取り消しさせていただくこともあります.

★論文提出締切後の原稿差し替えはできません
 論文提出締切後は,訂正版のアップロードやウェブ上での配布などの原稿
 差し替えは一切できませんので,予めご留意ください.
 ※正誤表の掲載が可能な場合がありますのでご相談ください.

★研究会幹事団
 主査: 乾健太郎 (東北大学)
 幹事: 岡崎直観 (東北大学), 小町守 (首都大学東京), 森信介 (京都大学)