第215回NL研究発表会

第215回自然言語処理研究発表会

標記の研究発表会はペーパレスで行います(貸し出し用のUSBメモリもご用意しています)。
  • 研究会に登録されている方
    研究報告は開催初日の1週間前(=公知日)に電子図書館当日用サイト(登録会員用)で公開します。

  • 研究会に登録されていない方
    当日受付で資料閲覧用のアカウント情報(URL,ID,PW)をお渡しいたします。
    尚、研究会にご登録いただくことで当研究会のバックナンバーも含めて全て電子図書館でご購読いただけます。登録に関しては 研究会に登録する」のページをご参照ください。

参加募集・プログラム

----------------------------------------------------------------------
情報処理学会 第215回自然言語処理研究会 研究発表会
参加募集
----------------------------------------------------------------------

◎ 日程: 2014年2月6日(木)

◎ 会場: 国立情報学研究所 1901号室
    アクセス案内: http://www.nii.ac.jp/about/access/

◎ 研究会ホームページ:

   http://www.nl-ipsj.or.jp/

◎ 照会先:

* 研究会に関する問い合わせ先:
船越 孝太郎 ((株)ホンダ・リサーチ・インスティチュート・ジャパン)
E-mail: funakoshi (at) jp.honda-ri.com

* 会場に関する問い合わせ先:
宮尾 祐介 (国立情報学研究所)
E-mail: yusuke (at) nii.ac.jp

======================================================================
プログラム (発表件数 10件)

2月6日(木) 09:30〜18:00
[09:30〜11:30] 言語モデル・統計処理     [4件]
[13:00〜15:00] 自然言語処理一般       [4件]
[15:15〜16:45] 自動問題解答         [2件] *3枠分の発表時間
[17:00〜18:00] IJCNLP/EMNLP参加報告
======================================================================

2月6日(木) 09:30〜18:00

● 09:30 - 11:30 言語モデル・統計処理

座長: 持橋大地(統計数理研究所)

(1) Hierarchical Statistical Machine Translation Using Sampling Based Alignment
○Liu Tongxu, Lepage Yves (Waseda University)

We propose an extension of the sampling-based alignment technique to
implement the hierarchical phrases based model. The proposed technique
outputs a hierarchical phrase based rule table. It is learned from a
bi-text without any syntactic information or any linguistic commitment.
We expect the following advantages from our rule tables: 1. better
reordering, 2. better translation of discontinuous phrases.

(2) Modifying Existing Analogy-based N-gram Language Model
○Tian Meng, Lepage Yves (Waseda University)

By investigating the occurrence of different proportional analogies in
corpora, this paper describes an approach to increase the performance of
existing analogy-based N-gram language models evaluated by perplexity.
Our approach consists in using analogy to reconstruct N-grams from the
test data so as to give higher probabilities to these N-grams. By giving
different weights to different patterns, we also except that some N-grams
which can be reconstructed by different patterns will get more accurate
probabilities. The use of suffix arrays for data searching leads to a
lesser computation time on text scoring tasks.

(3) Improving N-gram Distribution for Sampling-based Alignment by Extraction of Longer N-grams
○Zhang Suchen, Luo Juan, Lepage Yves (Waseda University)

Translation tables are an essential component of statistical machine
translation system. The sampling-based alignment method is a way of
building translation tables. It has advantages in speed and accuracy,
but lays slightly behind in translation evaluations compared to the
standard alignment technique. Previous research has proved that the
sampling-based alignment method does not generate enough long Ngram
alignments. This harms in translation evaluation. This paper investigates
translation table obtained by the sampling-based alignment method in
detail and introduces an improved distribution to allot time for
different N-gram lengths. The new model helps in outputting more numerous
longer N-grams. We report significant improvements in BLEU scores in
110 Europarl language pairs.

(4) 認知文法に基づく言語モデル
○呉暁一,松本裕治(奈良先端)

本論文では、認知文法の基本理論に基づき、非連続表現にも適用できる言語モ
デルを提案する。更に、提案モデルのトレーニングに関して、認知文法の「漸
次的抽象」理念を借り、あらゆる言語にも適用できる教師無し学習法を考案す
る。提案モデルと手法は完全に認知文法の理論に相容れる為、認知文法の部分
実装ともみることができる。日本語のデータセットでの実験により、提案法の
有効性を確認した。


● 13:00 - 15:00 自然言語処理一般

座長: 相澤彰子(国立情報学研究所)

(5) デジタル言語学: 雑音の多い空間回線を伝達する音声信号の進化と、静かな脳内回路における内言記号の不変の構造
○得丸公明(衛星システムエンジニア)

ヒトの言語は脊髄反射であるようだ.その分子生物学的基盤は他の脊椎動物と
同じ脳室内の脳脊髄液中の免疫細胞ネットワークである.およそ7万7千年前か
ら6万6千年前にかけて,ヒトは音素とアクセントを獲得し,音声波形を使って
デジタル通信を開始した.音声波形は,音声,文字,アナログ電気通信,二値
的コンピュータ・ネットワークと進化をとげた.一方で,脳内の音声記号の形
態は,一貫して免疫細胞ネットワークのままである.(i) 二分法論理によるパ
ターン認識を行う抗原抗体反応と,(ii) 文法と思考を操作するための二元論論
理による信号伝達系である.

(6) キャプションテキスト感情の分析による プライバシー侵害シーン抽出
高田さとみ,○周子胤,高田美樹,大本茂史,岸本哲也,奈良育英,嶋田茂(首都大学)

ウェアラブルコンピュータ装備のカメラによるプライバシー侵害を危惧する意
見が高まりつつあり, その利便性が否定されかねない. そこで,我々はGoogle
glassに関するYoutube記事から機微な意見の多いプライバシー侵害動画記事を
収集した. さらに, テキストに変換した動画の音声を利用し, 動画記事に含ま
れる投稿者や撮影者の感情分析を行った. これにより, 投稿者や撮影者の感情
からプライバシー侵害のシーンを抽出している.

(7) 学生のレポートにおける非論理的接続表現の分析
○松本章代,大友麻実(東北学院大学)

我々は「科学技術文書作成支援システム」を数年前より開発し,大学における
作文指導において実際に利用している。これは,学生自身による推敲・校正を
支援する教育システムである。現在,本システムに,論理的に問題のある個所
を自動検出し指摘する機能を追加することを目指している。本稿では,文をつ
なぐ接続表現に着目し,実際の学生レポートと査読付き論文とを比較しながら,
論理的な問題が生じやすい箇所を分析する。

(8) 難易度及び類似度を用いたコンピューター関連書籍推薦システムの開発
○舟木類佳,黒田久泰(愛媛大学)

コンピューター関連の書籍を学習する者にとって書籍の内容がやさしいか、難
しいかといった指標は重要である。そこで本研究では難易度による書籍の推薦
システムの開発を行った。難易度の比較は類似度が高い書籍間で行われると考
え、本研究ではまず、潜在的ディリクレ配分法及びコサイン類似度によって目
次及び書名の類似度を求めた。その後、予め難易度付与を行った一部の書籍に
対して重回帰分析により難易度の予測式を求めた。この予測式を用いて難易度
を予測し、類似度が近い書籍同士の難易度比較を行い利用者に書籍を推薦する
システムを開発した。


● 15:15 - 16:45 自動問題解答

座長: 小町守(首都大学東京)

(9) 質問応答システムを用いた多岐選択式問題の解答器の作成に関する研究
○石下円香(国立情報学研究所),狩野芳伸(JST/NII),神門典子(国立情報学研究所)

本研究では、多岐選択式の歴史科目の試験問題を解くために、既存の質問応答
システムを用いる手法を提案する。質問応答システムとは、自然言語での質問
文を入力とし、情報源から解答そのものを抽出して提示するシステムである。
本稿では、多岐選択式の試験問題として、大学入試センター試験の世界史Bと
日本史Bを対象とした。センター試験の問は既存の質問応答システムが想定する
入力・出力形式とは異なっているため、問を解くための処理を追加する必要が
ある。本手法では、質問応答システムそのものには変更を加えず、問を解くの
に適した質問文を生成し、質問応答システムに入力し、解答を得たのちに選択
肢を選ぶ処理を行う手法を採用した。センター試験の問には、空欄に入る語を
選ぶ問や、文の真偽の判定をする問など様々な形式がある。本手法では、問の
形式ごとに質問文の生成方法を変えることによって、形式の違いに対応した。
センター試験の過去問題及び代々木ゼミナールが作成したセンター試験模試の
結果、世界史で約4割、日本史で約3割5分の正解率が出せることが分かった。

(10) 代ゼミ模試に挑戦2013---『国語』現代文 (※2枠分)
○佐藤理史,○加納隼人,○西村翔平(名古屋大学)

我々は、センター試験『国語』現代文の問題を解くシステムを実装し、代々木
ゼミナールのセンター 模試に挑戦した。本論文では、今回で使用した解答器
の技術的詳細と模試の結果について報告する。


● 17:00 - 18:00 IJCNLP/EMNLP参加報告

発表者:中澤敏明(JST),江原 遥(NII) (敬称略)

======================================================================
★ 研究報告のペーパーレス化

本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行いませ
ん.また,特許出願の公知日(研究報告の公開日)が従来より1週間早まります
ので,ご留意ください.

[自然言語処理研究会に登録されている方]
研究報告は研究発表会の一週間前に電子図書館と当日閲覧用サイトで公開しま
す.当日は資料をプリントアウトしてご持参いただくか,ご自身のPCにダウン
ロードの上PCをご持参ください.

■情報処理学会電子図書館(情報学広場)
※ご利用にはユーザ登録が必要です.
https://ipsj.ixsq.nii.ac.jp/ej/
■当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/
[自然言語処理研究会に登録されていない方]
当日受付で当研究発表会の資料閲覧用にUSBメモリを貸し出します.当日はノー
トPC等をご持参ください.尚,当研究会にご登録いただくことで当研究会の資
料のバックナンバーも含めてすべて電子図書館でご購読いただけます.登録さ
れていない方は,是非この機会に研究会に登録してください.
(登録まで最大3日かかりますのでご留意ください)

発表申込み

----------------------------------------------------------------------
情報処理学会 第215回自然言語処理研究会 発表募集
----------------------------------------------------------------------

◎ 日程: 2014年2月6日(木), 7日(金)

◎ 会場: 国立情報学研究所 1901号室
     http://www.nii.ac.jp/about/access/

◎ 発表申込締切: 2013年12月20日(金)

◎ 原稿締切: 2013年 1月10日(金) を予定 ※締切厳守
   正式な締切日と執筆要領等は,
   申込後に学会事務局から届く原稿執筆依頼をご参照ください
   ※12月26日までに原稿依頼が届かない場合は,
   情報処理学会 研究会担当 渡辺未果までご連絡ください.
   Tel:03-3518-8372

◎ 原稿ページ数:1ページ~
 電子化にともないページ数に制限はありません.
 ※ただし20ページを越える場合は事前にご連絡ください.

◎ 発表時間予定: 一般形式 1件30分 (発表20分、質疑10分)
※ 発表時間の調整について
従来の一般形式(発表20分,質疑10分)に加えてショート形式(発表10分,
質疑10分),討議形式(発表10分,質疑討論20分)など,発表者からの要望
に応じて発表の合計時間を調整したいと思います.アイデアレベルの研究
の紹介や,研究の詳細まで話したいので時間がほしい,などの要求を発表
申込の備考欄にご記入いただければ,それらを考慮してプログラムを作成
したいと思います.ぜひご活用ください.

◎ 発表申込先: 下記専用サイトよりお申込みください.

 *自然言語処理研究会用申込ページ: https://ipsj1.i-product.biz/ipsjsig/NL/

 (研究会ホームページ: http://www.nl-ipsj.or.jp からもアクセスできます)

◎ 照会先:

 * 研究会に関する問い合わせ先:
 船越 孝太郎 ((株)ホンダ・リサーチ・インスティチュート・ジャパン)
 E-mail: forest (at) i.kyoto-u.ac.jp

 * 会場に関する問い合わせ先:
 宮尾 祐介 (国立情報学研究所)
  E-mail: yusuke (at) nii.ac.jp
 

★ 受け付けは先着順で行なっております.
締切間際になりますと,申し込み件数によりましては次回の研究会にまわって
頂くようお願いする場合がございます.申し込みを予定しておられます方はな
るべく早めにお申し込み下さい.

★ 締め切り後の発表キャンセルは原則としてできません.
発表申し込み後にキャンセルの必要が生じた場合にはなるべく早くご連絡くだ
さい.発表申込後,学会が提示する原稿提出締め切りまでに原稿が到着しない
場合には,幹事団の判断により発表を取り消しさせていただくこともあります.