E分野 自然言語・音声・音楽 |
選奨セッション 自然言語・音声・音楽 |
8月25日(水) 9:30-12:00 1d会場
座長 松原正樹(筑波大)
須藤克仁(奈良先端大) |
CE-001 |
感情分類を用いた単語分散表現からの感性情報抽出
◎松永拓己・松本和幸・北 研二・吉田 稔(徳島大)
×
CE-001感情分類を用いた単語分散表現からの感性情報抽出
◎松永拓己・松本和幸・北 研二・吉田 稔(徳島大)
近年,自然言語処理の分野では単語分散表現から感情推定を行う技術が研究されている.それらの研究では分散表現全体から単語の情報を抽出しており感性以外の情報が多く含まれている. 本研究では感性情報のみを抽出することでその精度上昇を目指す.その手法として単語分散表現から感情分類を行うニューラルネットワークを作成し,ネットワークが学習した重みから感性情報が強く表れている次元を抽出し,コサイン類以度を用いた評価を行う. 実験の結果,感性ごとの類似語には元の分散表現の類似語以外が現れ,それらに意味的共通点が見られたことから,提案手法により,特定の感性に特化した単語分散表現を作成可能だと考えられる. |
CE-002 |
宿泊予約サイトのユーザレビューにおけるクレーム抽出と内容解析による課題抽出
青栁直人・○蓮池 隆(早大)
×
CE-002宿泊予約サイトのユーザレビューにおけるクレーム抽出と内容解析による課題抽出
青栁直人・○蓮池 隆(早大)
宿泊予約はWeb上の旅行予約サイトでの予約が主流となっており,利用者は予約サイト上の宿泊レビューを参考に宿泊施設を選択することが多い.したがって,宿泊施設としては宿泊レビューの解析を行い,改善点の発見やマーケティングに活用することが望ましい.本研究では,レビューの中で特に重要と考えられる「クレーム」を解析する手法を提案する.具体的には,宿泊レビューからクレーム文を自動検出し,その内容を解析することで宿泊施設にとって有用な情報を提供することを目指す.実際の宿泊レビューデータを用いた分析を行うことで,提案手法の有効性を示す. |
CE-003 |
階層的知識蒸留による発話単位系列ラベリングのモデル軽量化
◎折橋翔太・山﨑善啓・牧島直輝・庵 愛・高島瑛彦・田中智大・増村 亮(NTT)
×
CE-003階層的知識蒸留による発話単位系列ラベリングのモデル軽量化
◎折橋翔太・山﨑善啓・牧島直輝・庵 愛・高島瑛彦・田中智大・増村 亮(NTT)
本稿では、会話ドキュメントへの発話単位の系列ラベリングに対する、知識蒸留法を提案する。発話単位系列ラベリングは、発話毎の短期文脈と、発話間の長期文脈を理解する2つのネットワークを階層的に用いる手法が有効であるが、高精度なラベリングには大規模なモデルが必要となる。本手法では、高精度なラベリングを軽量なモデルで実現するため、高精度で大規模な教師モデルに学習された知識を用いて、軽量なモデルを効果的に学習する知識蒸留を適用する。特に、教師モデルが捉える複雑な文脈の知識を効率的に蒸留するため、本手法では、短期文脈および長期文脈を理解するネットワークの出力が、教師モデルの各出力を模倣するよう学習する。 |
CE-004 |
レアなモーラを含む日本語歌唱データベースの構築と基礎評価
○森勢将雅(明大)・藤本 健(フラクタル・デザイン)・小岩井ことり(ピアレスガーベラ)
×
CE-004レアなモーラを含む日本語歌唱データベースの構築と基礎評価
○森勢将雅(明大)・藤本 健(フラクタル・デザイン)・小岩井ことり(ピアレスガーベラ)
本研究では,統計的な歌声合成手法への展開を目的とした使いやすい歌唱データベース(DB)の構築について述べる.既存の楽曲からなる歌唱DBの場合,著作権があるため配布に制約が生じることや,特定のモーラが存在しないことが問題となる.ここでは,新たに1時間程度の歌声となる長さでオリジナルのメロディ,歌詞からなる楽曲リストを歌唱DBとして構築することで,この問題の解決を図る.本DBは歌いやすさを意識しつつ,既存の歌声では出現頻度の低い「きぇ」や「とぅ」などを最低限は含む歌詞から構成される.本発表では,既存の楽曲リストを対象にモーラのカバー率やエントロピーに関する評価を実施し,本DBの有効性を示す. |
自然言語処理(情報抽出) |
8月25日(水) 13:10-15:10 2c会場
座長 笹野 遼平(名大)
座長補佐 内田 ゆず(北海学園大) |
E-001 |
新素材研究開発分野における文献からの研究支援情報抽出技術の提案
◎照屋絵理(日立)・小野寛太(高エネルギー加速器研)・竹内 理・森田秀和・林 貴之(日立)
×
E-001新素材研究開発分野における文献からの研究支援情報抽出技術の提案
◎照屋絵理(日立)・小野寛太(高エネルギー加速器研)・竹内 理・森田秀和・林 貴之(日立)
新素材研究開発分野では、自然言語処理技術を用いて、技術文献から素材に関する情報を抽出することにより、新規研究分野検討支援などの研究支援を可能にしたいというニーズがある。我々は論文から研究キーワード、キーワード間の関係性および時系列変化を抽出、可視化する技術を開発した。評価の結果、新規研究分野の検討材料となる有効な情報が抽出され、本技術により研究支援が可能となる見込みを得た。 |
E-002 |
深層学習を用いたユーザー指向型類似文抽出の幾何的近似
◎槇尾純太(徳島大)・深谷寛子(東京ガスエンジニアリングソリューションズ)・森田和宏・泓田正雄(徳島大)
×
E-002深層学習を用いたユーザー指向型類似文抽出の幾何的近似
◎槇尾純太(徳島大)・深谷寛子(東京ガスエンジニアリングソリューションズ)・森田和宏・泓田正雄(徳島大)
近年,深層学習が様々な分野で応用されているが,検索などのシステムに応用する際にモデルの大規模化などに伴って計算量が増大することが問題になる.本研究はユーザーの趣向や目的などを学習して良質な結果を出力する類似文書抽出への深層学習の応用に焦点を当てる.類似文書抽出は,深層距離学習で写像したデータ間の距離を測る手法が一般的であるが,学習を行うたびに対象となる全てのデータに対して写像を計算する必要性があり現実的ではない.そこで,本研究では逐次学習における計算量を減らし,幾何的観念から得られる近似によって対象データの写像を必要としない実用的な類似文書抽出を提案する. |
E-003 |
中国伝統医学における文献を用いた証間因果関係の抽出
◎齋藤 陸(仙台高専)・関 隆志(フジ虎ノ門整形外科病院)・高橋晶子・力武克彰(仙台高専)
×
E-003中国伝統医学における文献を用いた証間因果関係の抽出
◎齋藤 陸(仙台高専)・関 隆志(フジ虎ノ門整形外科病院)・高橋晶子・力武克彰(仙台高専)
近年伝統医学が補完医療として注目されており,特に中国伝統医学(中医学)は2019年に国際疾病分類第11版の伝統医学分類に追加されるなど,関心が高まっている.中医学で重要な概念で患者の心身の状態を表す「証」の間には,ある証によって他の証が引き起こされるような因果関係が存在し,診断時に考慮する必要がある.しかし,証の因果関係に関する知識は膨大な中医学文献を読むことでしか得ることができず,経験の少ない医師の負担となっている.そこで本研究では,中医学文献の説明文中の各単語を用いて証の特徴付けを行った後,証の特徴を用いて証間の因果関係を抽出する手法を提案し,診断支援に有効な関係が抽出できるか検証する. |
E-004 |
小説本文から抽出した人物情報の構造化手法の検討
◎岡 裕二・安藤一秋(香川大)
×
E-004小説本文から抽出した人物情報の構造化手法の検討
◎岡 裕二・安藤一秋(香川大)
近年,電子小説や小説投稿サイトなどの発展により,時間や場所を問わずに小説を読めるようになった.一方,小説数の増加によって,個人の嗜好に合う作品を探すことは難しくなった.また,隙間時間を利用した読書が容易になったが,一冊を読み終えるまでの時間は長くなり,それまでの内容を振り返るための読み返しが増加している.我々は,物語の展開や登場人物の特徴に関する嗜好を用いた小説検索やあらすじ生成などにより,これらの問題を軽減できると考えている.本稿では,小説テキストから抽出した人物情報を検索支援やあらすじ生成に利用することを目的に,ファンタジー小説のテキストから抽出した人物情報を構造化する手法について検討する. |
E-005 |
アラビア語レシピ中のアレルゲン認識に関する一考察
◎大坪愛佳・ファティマ アルハビブ・大和矢悠仁・延澤志保(東京都市大)
×
E-005アラビア語レシピ中のアレルゲン認識に関する一考察
◎大坪愛佳・ファティマ アルハビブ・大和矢悠仁・延澤志保(東京都市大)
アレルギーを持つ人がアラビアの伝統料理を安心して食べられるよう,本研究では,アラビア語レシピからのアレルゲン推定を行う.アラビア語レシピについて調査した結果,アラビア語から日本語への翻訳に問題があり,油を石油と翻訳した例など,翻訳誤りの修正の必要性があることが分かった.また,レシピには材料の原材料にアレルゲンが含まれることがあり,アレルゲンの判定には原材料の検索が必要だが,バルガーなどのアラビア料理独自の食材の検索が困難であるなど問題点があることが分かった. |
E-006 |
ハラル推定のための日本料理の原材料認識に関する一考察
◎ファティマ アルハビブ・大坪愛佳・大和矢悠仁・延澤志保(東京都市大)
×
E-006ハラル推定のための日本料理の原材料認識に関する一考察
◎ファティマ アルハビブ・大坪愛佳・大和矢悠仁・延澤志保(東京都市大)
イスラム教ではアルコールや特定の食品が禁止されている.日本料理に禁止食品が含まれるかをアラビア人が判断することは困難なため,日本に旅行したくてもしないイスラム教徒が多い.そのため本研究では,禁止食品の含有の有無の自動推定を目的とする. 料理レシピには,材料欄に記載されない材料の存在や,材料欄の材料の原材料にアルコールなどが含まれる可能性があるため,他の文書も用いて原材料を調べる必要がある.Web上の文書を用いた原材料の推定について検討した結果,隠れた原材料の推定だけでなく,表記の揺れや別表示同語,同一表示別語の問題や,レシピなどの文書の翻訳時の誤りの問題など,複数の課題を確認した. |
自然言語処理(言語生成・評価) |
8月25日(水) 13:10-15:10 2d会場
座長 横野 光(富士通)
座長補佐 田村 晃裕(同志社大) |
E-007 |
BERTによる国語記述式答案の自動採点における採点アノテーションの重要性
◎高野峻矢・市川 治(滋賀大)
×
E-007BERTによる国語記述式答案の自動採点における採点アノテーションの重要性
◎高野峻矢・市川 治(滋賀大)
理研記述問題採点データセットを用いた自動採点の従来研究においては,LSTMとアテンションにより採点項目ごとの埋め込みベクトルを生成し,それを用いて得点を推定する手法が高い性能を示している。本報告では,LSTMの代わりにBERTを用い,採点アノテーションが付与された部分の埋め込みベクトルを採点項目ごとに寄せ集めることにより,データセットのいずれの問題においても、QWKが0.90以上と高い値となることを示す。実用の際には,対象の正解の採点アノテーションは利用できないので,それを高精度に推定することが今後の課題となる。 |
E-008 |
BERTを用いた記述式問題の自動採点に関する研究
◎藤野準平・徳山 豪(関西学院大)
×
E-008BERTを用いた記述式問題の自動採点に関する研究
◎藤野準平・徳山 豪(関西学院大)
2020年度から始まる大学入学共通テストには記述式問題が導入され,その採点にかかる時間や労力について問題となっていた.そこで,その問題を解決する方法として自動採点が研究されてきた.中でも機械学習を用いた自動採点が近年では多く提案されており,双方向LSTMを用いた自動採点システムなどが提案されてきた.本研究では,文脈を読み取ることができる深層学習モデルBERTを用いて自動採点に関する実験を行い,その結果の評価と考察を行った. |
E-009 |
質問応答を用いた日本語要約評価システム
◎岡田直士・松澤智史(東理大)
×
E-009質問応答を用いた日本語要約評価システム
◎岡田直士・松澤智史(東理大)
要約評価で多く用いられる手法は文章の意味的な正確さを考慮することが出来ず、表面的な類似性を測ることがある。そこで、本研究では質問応答タスクを使用した日本語要約評価手法が、既存の評価手法よりも意味的な正確さを考慮可能か検証することを目的とした。質問生成の実装では、COTOHA APIを用いた深層格の識別に焦点を置いた。また、解答生成の実装では日本語版BERTモデルを利用し、運転ドメインQAデータセットに合わせたfine-tuningを行った。実験ではlivedoorニュースの運転記事を使用し、事実と一致する要約文と事実に反する要約文を対象にすることで既存評価手法との比較を行った。結果として、従来の評価手法より事実に重きを置いた評価が可能であると示した。 |
E-010 |
Bidirectional LSTMを用いた誤字脱字検出による採点項目別自動採点の改善
◎倉田基成・作田航平・横尾拓未・森康久仁・須鎗弘樹(千葉大)
×
E-010Bidirectional LSTMを用いた誤字脱字検出による採点項目別自動採点の改善
◎倉田基成・作田航平・横尾拓未・森康久仁・須鎗弘樹(千葉大)
記述式問題の採点補助として,自動採点を行うシステムが求められている.従来の研究では解答を採点項目ごとに採点する自動採点モデルが提案されているが,誤字脱字等の誤りに対する採点項目の採点精度が他の採点項目の採点精度よりも低い.原因として採点項目の内容に関わらず同一のネットワークを用いて採点を行っていることが考えられる.そこで,本研究では誤字脱字を検出するBidirectional LSTM を用いた言語モデルを用いて,誤字脱字等の誤りに対する採点項目と他の採点項目を異なるネットワークで採点する自動採点モデルを提案する.提案手法による国語記述式問題の自動採点を行った結果,従来手法と比較して精度の向上が見られた. |
E-011 |
拍数を考慮したサブワード単位の俳句自動生成
◎仲村勇馬・山本幹雄(筑波大)
×
E-011拍数を考慮したサブワード単位の俳句自動生成
◎仲村勇馬・山本幹雄(筑波大)
575の定型を持つ詩である俳句の自動生成において、音数という素性は有効であることが知られている。しかし、送り仮名が不確定であることや熟字訓などの影響で、サブワードに対して一意な音数を割り当てることは困難である。本研究では音数素性の使用とサブワード単位での俳句生成を両立することを目的として、サブワード分散表現と単語分散表現を相互変換する機構を導入し、その効果を検証する。 |
E-012 |
(講演取消) |
音楽情報処理 |
8月25日(水) 15:30-17:30 3d会場
座長 澤田隼(東理大)
座長補佐 平井辰典(駒澤大) |
E-013 |
「Real Time Risset Rhythm Generator」から「Live Sampling Risset Rhythm」への道
○長嶋洋一(静岡文化芸術大)
×
E-013「Real Time Risset Rhythm Generator」から「Live Sampling Risset Rhythm」への道
○長嶋洋一(静岡文化芸術大)
ピッチに関する有名な錯聴の"Shepard Tone"を、Jean-Claude Rissetがリズムに拡張した錯聴が"Risset Rhythm"である。筆者はMax8環境下での"Risset Rhythm"再構築として、リズムだけでなくピッチ要素を持つ音楽フレーズでの実装、左右チャンネルで無限加速と無限減速する実験、生成する"Risset Rhythm"のパターンをライブ変容させる「Real Time Risset Rhythm Generator」を提案した。本稿ではこの先にある「常にテンポが連続的に加速/減速する音楽」のための手法へのアプローチについて検討報告する。 |
E-014 |
フレーズパターンの複雑性推定による難易度選択可能なベースフレーズ自動生成方式の実現
◎下川聖弥・岡田龍太郎・中西崇文(武蔵野大)
×
E-014フレーズパターンの複雑性推定による難易度選択可能なベースフレーズ自動生成方式の実現
◎下川聖弥・岡田龍太郎・中西崇文(武蔵野大)
本稿では,楽曲のテンポ・コード・難易度を入力することでその楽曲にあったベースフレーズを自動で生成するシステムの実現方法について述べる.本システムでは,あらかじめ用意したベースフレーズのパターンに対して演奏における難易度の推定を行いデータベースに登録しておき,利用時にはユーザが生成したい楽曲のテンポ・コード・難易度を入力することで,それを反映させたベースフレーズを生成する.本システムを用いることで,既存楽曲に対してベースフレーズのアレンジをしたいユーザや,難しいベースフレーズを簡単な譜面で弾きたいユーザに対して,そのユーザの技量に合致したベースフレーズを柔軟に生成することができる. |
E-015 |
音楽検索のための楽曲特徴量についての調査
◎張 夢堯・成 凱(九産大)
×
E-015音楽検索のための楽曲特徴量についての調査
◎張 夢堯・成 凱(九産大)
大規模の音楽データベースから聴きたい楽曲を効率的に探し出すために、音楽検索技術が重要である。音楽検索は、テキストによる楽曲検索、鼻歌検索、音楽認識など、様々な方式に分かれている。楽曲が持つ音楽的な特徴を表す指標として,楽曲特徴量を定義する。楽曲特徴量は楽曲の楽音信号を分析することによって抽出される。音楽検索を行う際に利用する楽曲特徴量が様々あり、どれが有効であるかについて、まだ体系的に明らかになっていない。 本研究では、音楽検索のための楽曲特徴量を考察し、どの楽曲特徴量が音楽検索に有効であるか,また検索方式によってどの楽曲特徴量が大きな影響を与えるかの調査を行う。 |
E-016 |
楽曲聴取における個人差を考慮したリラクゼーション効果の分析
◎大城昂希・姜 東植(琉球大)
×
E-016楽曲聴取における個人差を考慮したリラクゼーション効果の分析
◎大城昂希・姜 東植(琉球大)
人々には生活の中でストレスを解消することが必要であり、音楽によるリラクゼーション効果は広く知られている。 しかし、音楽のリラクゼーション効果には個人差が存在し、聴取者に合った音楽を聴取することが重要である。 本研究では、聴取者が音楽に対して抱く印象と個人差に対して焦点を当て、個人差を考慮した印象評価モデルの提案を行う。 本研究において個人差を示す要因としてパーソナリティ特性を用いた。 85名の大学生のパーソナリティ特性と音楽の印象について分析した結果、楽曲の印象にはパーソナリティ特性が影響している可能性が示された。 さらに、3名の大学生に対して脳波を用いたリラックス度と印象評価関係を分析した結果、1名の被験者に関して「暗い-明るい、日常的な-ドラマチックな」という印象とリラックス度に有意な相関関係が見られた。 |
E-017 |
複数音の協和性を表現可能な特徴量を用いたCNN-LSTMコード進行推定法
◎伊藤 威・荒井秀一(東京都市大)
×
E-017複数音の協和性を表現可能な特徴量を用いたCNN-LSTMコード進行推定法
◎伊藤 威・荒井秀一(東京都市大)
近年、コード進行推定の分野ではCQTスペクトログラムを入力特徴量とした深層学習による手法が成果を上げている。しかし、聴感上では全く異なる音色のCメジャーとAマイナーなどのコードを誤認識する問題が存在する。これは、音高のみでコード推定することが原因であると考えた。そこで、本稿ではコードの音色は構成音の協和に基づくことに着目し、各音高が持つ倍音成分をも表現可能な入力特徴量を提案する。この特徴量を用いてCNNでコードの協和性を学習し、LSTMでそれらの時系列予測を行う推定器を設計した。Isophonicsで提供されている383曲を用いて推定性能を評価した結果、従来手法の約10分の1のパラメータ数でも同程度の識別性能を達成したので、基本的な有効性が明らかになった。 |
E-018 |
各楽器音の時間-周波数特徴の変化に追従可能なDeform-Conv Dense U-Netによる音源分離法
◎竹田 舜・荒井秀一(東京都市大)
×
E-018各楽器音の時間-周波数特徴の変化に追従可能なDeform-Conv Dense U-Netによる音源分離法
◎竹田 舜・荒井秀一(東京都市大)
近年、音源分離では多くの手法がConvolutional Neural Network(CNN)を基にしており、U-NetなどのCNNを用いた深層学習法が提案され成果をあげている。本稿では楽器音の性質の違いに着目し、入力により動的に変化する機構でそれに追従可能であると考えた。これは、画像分類の研究で提案された動的に受容野を変形できるDeform-Convで実現できる。そこで、Dense Blockを用いたU-NetにDeform-Convを適用したDeform-Conv Dense U-Netを提案する。この手法は従来手法と比較してVocalsにおいて分離性能尺度であるSDRが0.4pt向上し、基本的有効性確認できた。 |
音声言語処理 |
8月25日(水) 15:30-17:30 3e会場
座長 森勢将雅(明大)
座長補佐 高島遼一(神戸大) |
E-019 |
環境に依存しない音声認識のための音源分離法
◎迫川海翔・崔 龍雲(創価大)
×
E-019環境に依存しない音声認識のための音源分離法
◎迫川海翔・崔 龍雲(創価大)
音声を主体とするコミュニケーション手段の利用, サービス環境の発展が目覚ましい. しかし, 主音源のみが容易に取得できる理想的な環境に技術の利用が限定される. 本講演では, これらの問題に対して, 主音声の基底情報を教師として利用する音源分離手法(非負値行列因数分解)について述べ, その分離精度向上のためのアプローチを紹介する. |
E-020 |
数学デジタル文書読み上げツールの開発
◎長谷川陽和・原 知鈴・福井哲夫(武庫川女子大)
×
E-020数学デジタル文書読み上げツールの開発
◎長谷川陽和・原 知鈴・福井哲夫(武庫川女子大)
近年STEM教育が重要視される中,2021年度からはGIGAスクール構想によって,デジタルデバイスが学校に全面導入されてきている。文部科学省はデジタル教科書の利点の一つに,音声読み上げ機能を挙げている。しかし,数学文書では,そこに含まれる数式を音声で読み上げることができないのが現状である。そこで本研究では,数学デジタル文書を数式も含め,読み上げられるようにすることを目的とする。結果,ドキュメント解析技術によって,高校数学全般のLaTeXをベースに記述された数学デジタル文書の音声読み上げツールを開発した。これにより,数学を学習する際に,音声でも確認することによって,より理解が深まる可能性がある。 |
E-021 |
Automatic Cough Detection with Using Throat Microphone for Health Monitoring
◎Rakib Bhuiyan・吉村和大(静岡大)・黒岩眞吾(千葉大)・西田昌史・西村雅史(静岡大)
×
E-021Automatic Cough Detection with Using Throat Microphone for Health Monitoring
◎Rakib Bhuiyan・吉村和大(静岡大)・黒岩眞吾(千葉大)・西田昌史・西村雅史(静岡大)
Cough is a common symptom of a variety of respiratory and non-respiratory illnesses. Numerous studies have already been conducted to detect cough sound. In this paper, we have simulated real life data, which includes not only coughing but also speaking, eating-related sound events like chewing, swallowing and also movement-related sound of the subject and cough data was induced by using the nebulizer though most of the previous studies were using pretended cough data. We attempted to demonstrate the efficacy of automated cough detection in a real-world setting and tried to detect coughing in dysphagia patients triggered by a mealtime mis-swallow. |
E-022 |
Transformerエンコーダを用いた英単語発声の音素継続時間長モデル化
◎鈴木 優・加藤恒夫・田村晃裕(同志社大)
×
E-022Transformerエンコーダを用いた英単語発声の音素継続時間長モデル化
◎鈴木 優・加藤恒夫・田村晃裕(同志社大)
第二言語学習者にとって正しい韻律の習得は,対象言語を発声する上で重要である.韻律の構成要素の1つにリズムがある.我々はこれまでに,英単語に含まれる隣り合う音節の時間の長短を母語話者の発声と比較する参照付き時間長パラメータを提案し,アクセント辞書情報から継続時間長パラメータを推定する決定木学習を行った.しかし,同推定手法は中心と前後の母音以外の情報を考慮できない制約があった.そこで本研究では,子音など母音以外の音素環境も柔軟に考慮するため,Transformerエンコーダを用いて音素とそのアクセント情報による継続時間長のモデル化を行う.提案手法の有効性を示すため,決定木学習を用いた手法と比較する. |
E-023 |
アンビソニックを用いたリアルタイム音場再現
◎原 啓記・藤村真生(大阪工大)
×
E-023アンビソニックを用いたリアルタイム音場再現
◎原 啓記・藤村真生(大阪工大)
本研究ではルームスケールVR等に応用可能な、リスナーの移動に対応する立体音響システムの構築を目指す。現在立体音響を実現するためには22.2channel、Wave Field Synthesis、Ambisonic、Binauralといった様々な手法がある。しかし、再現された音場をリスナーが音の聞こえる方向へ移動しても、音の聞こえ方が変わらず没入感の損失につながることが問題とされている。そこで本研究では、1次Ambisonicマイクを用いて音場の各点で収録し、リスニング点に近い信号を合成し音場を再現することでリスナーが自由に移動可能な手法を提案する。講演では、システムの紹介と検証結果を示す。 |
自然言語処理(文書分類・応用) |
8月26日(木) 9:30-12:00 4e会場
座長 木村 泰知(小樽商科大)
座長補佐 小林 暁雄(農研機構) |
E-024 |
機械学習モデル及びBERTによる刑種の推定に関する性能比較
◎德田 翔(防衛大)・白川智弘(長岡技科大)・佐藤 浩(防衛大)
×
E-024機械学習モデル及びBERTによる刑種の推定に関する性能比較
◎德田 翔(防衛大)・白川智弘(長岡技科大)・佐藤 浩(防衛大)
司法業務において判決を出すまでには十分な議論を行う時間が必要である.その議論を有意に短縮し,公平な結論を出すことは司法において望まれることである.人工知能技術を用いてその判断の補助をすることによりこれを達成すべく,本研究では深層学習による自然言語モデルであるBERTを利用した犯罪事実からの刑種の推定を行い,既存の機械学習手法との性能比較を実施した.その結果,BERTモデルでは既存手法よりも約8ポイントの性能向上が見られ、事例のキーワードや行為に基づき刑種をある程度選択することができることが分かった. |
E-025 |
既読率に基づいた記事推薦システムについての研究 -サイト利用を伴ったユーザーテスト-
◎原田真熙・和田雄次(電機大)
×
E-025既読率に基づいた記事推薦システムについての研究 -サイト利用を伴ったユーザーテスト-
◎原田真熙・和田雄次(電機大)
ニュースサイト等,WEB上には記事が投稿されるサイトが多数ある.そこで使われている推薦方法の一つに,ユーザーの閲覧した記事を基に,それに類似した記事を推薦するというものがある.しかし,閲覧した記事の中には閲覧してみたものの興味がなく,途中までしか読まない記事が存在する.そのような記事を,読了した記事と同様に扱うと興味のない記事を推薦する可能性がある. そこで本研究では,ユーザーが閲覧した記事をどこまで読んだかという情報を”既読率”とし,それを推薦システムに組み込むことで,興味が高い記事を推薦する精度を上げることを目的とする.本発表では提案システムを組み込んだサイトにてユーザーテストを行い,その結果に対する評価を中心に行う. |
E-026 |
脚本術に従った事業者体験の文書化による訴求力向上
◎上原大暉・島川博光(立命館大)
×
E-026脚本術に従った事業者体験の文書化による訴求力向上
◎上原大暉・島川博光(立命館大)
本論文では,脚本術に従い事業者が実体験を文書化し,作成した文書と実際の映画脚本との類似性から,不足表現を検出する手法を提案する.近年,Web上での広告用文書の発信は重要である.また,読者の共感を得られる文書の作成が必要である.しかし,事業者本人による文書の完成度の評価は難しい.そこで,脚本術が説く,物語の種類ごとの場面展開に着目する.事業者は選択した物語の種類に適した場面展開に合わせ実体験を記述する.ロジスティック回帰により,この記述の場面を予測する.予測結果から,各場面での不足表現を検出する.不足表現を指摘された事業者は,読者の共感を得られる広告文書へ記述を洗練できる. |
E-027 |
(講演取消) |
E-028 |
新聞コーパスを用いたSDGsが掲げるターゲットにおける話題性の時系列トレンド
○毛利 研(トーマツ)・春日 剛(国際協力銀行)・大場久永(トーマツ)・中原えりか(国際協力銀行)
×
E-028新聞コーパスを用いたSDGsが掲げるターゲットにおける話題性の時系列トレンド
○毛利 研(トーマツ)・春日 剛(国際協力銀行)・大場久永(トーマツ)・中原えりか(国際協力銀行)
本研究は過去約10年分の新聞記事コーパスデータを用いて,SDGsに対するオルタナティブ・データ活用を検討するべく,SDGsターゲットにおける話題性の時系列トレンドや注目するべきセクタの抽出を試みた. |
E-029 |
(講演取消) |
E-030 |
自然言語処理を用いた文章のカテゴリー分類における比較検討
◎元木英理香・高岡詠子(上智大)
×
E-030自然言語処理を用いた文章のカテゴリー分類における比較検討
◎元木英理香・高岡詠子(上智大)
10000個の文章データに対して、分類数を複数設けて文章分類を行った。ニュース記事、商品のレビュー文章、など様々なラベル付き文章データセットを用意した。どのデータセットにおいても、二値分類が最も精度が良く、分類数を増やすとそれに従って精度が下がる、という仮説を立てた。仮説を確かめるために、データを分類数に合わせて整形し、ラベル付き文章データセットを各種アルゴリズム(BERT, ALBERT, XLNET)に当てはめた。得られた結果を元に仮説が検証されたか、分類数、アルゴリズム毎に主だった特徴は見られるのかに関して考察をし、同時にデータセットに見合った分類数、アルゴリズムの提案をする。 |
自然言語処理(言語モデル・語彙) |
8月26日(木) 15:30-17:30 5e会場
座長 内海 慶(デンソーアイティーラボラトリ)
座長補佐 亀甲 博貴(京大) |
E-031 |
日本語事前学習言語モデルにおける語彙の直接的操作を用いたドメイン適応の試みが下流タスクの精度に与える影響の評価
○浜 直史・安井雅彦・森 靖英(日立)・和久井一則(日立産業制御ソリューションズ)
×
E-031日本語事前学習言語モデルにおける語彙の直接的操作を用いたドメイン適応の試みが下流タスクの精度に与える影響の評価
○浜 直史・安井雅彦・森 靖英(日立)・和久井一則(日立産業制御ソリューションズ)
計算資源や言語資源が限定されているとき,公開されている汎用ドメイン向け事前学習言語モデルを用いて,少量のコーパスでFine-Tuningを行い,そのコーパスのドメインに適応させることが一般的に行われる。その折,事前学習言語モデル作成時にデータドリブンに構築された語彙を直接的に操作し,当該ドメインに頻出する固有表現を追加することでドメイン適応を促進できないかという試みが,もっとも単純な工夫として検討される。本報告では,このような事前学習言語モデルの語彙の直接的な操作が,Fine-Tuning後のタスクの精度に与える影響を系統的に評価し,一般には本操作がFine-Tuningの際のドメイン適応に寄与しないことを示す。 |
E-032 |
自動作成された類義語抽出ルールによる類義語抽出精度向上手法
◎我妻正太郎・照屋絵理・竹内 理(日立)
×
E-032自動作成された類義語抽出ルールによる類義語抽出精度向上手法
◎我妻正太郎・照屋絵理・竹内 理(日立)
機械学習による既存の類義語抽出手法は、企業における社内文書などのテキスト数が少ない場合に適用すると誤抽出が多発する。そこで、一部の類義語候補とユーザの入力から自動作成したルールにより、機械学習結果から尤もらしい候補を抽出することで誤抽出を削減する手法を提案する。評価の結果、既存手法と比較して精度が59%向上した。以上から、提案手法により、テキスト数が少ない場合における類義語抽出精度が向上する見込みを得た。 |
E-033 |
日本語WordNetとWikidata語彙の相互補完検証
○米持幸寿・大場みち子(はこだて未来大)
×
E-033日本語WordNetとWikidata語彙の相互補完検証
○米持幸寿・大場みち子(はこだて未来大)
自由形式入力を主とするテキストインターフェースにおける語の抽出では,その精度においてシステムが持つ語彙が大きな役割を持つ.自然言語研究の成果物として様々な言語資源が存在し,その言語資源を取り入れることで抽出精度を上げる研究が行われている.しかし,一つの言語資源から完全な語彙を獲得することは不可能である.複数の語彙を統合する先行研究はあるが,どのように補完関係が成り立っているかを示すものはない.本研究では食品,料理,魚介類などの名称が,日本語WordNetとWikidataを統合することでどのように相互補完され語彙強化され,効果的かを検証する. |
E-034 |
残存文長を考慮したRNNによる逐次的な改行挿入
◎飯泉智朗・大野誠寛(電機大)・松原茂樹(名大)
×
E-034残存文長を考慮したRNNによる逐次的な改行挿入
◎飯泉智朗・大野誠寛(電機大)・松原茂樹(名大)
聴覚障害者や高齢者,外国人らによる講演音声の理解を支援するための技術として, 字幕生成システムの開発が望まれている.字幕を生成する際,提示されたテキストが 読みやすくなるように,適切な位置に改行が挿入されている必要がある.本稿では,読みやすい字幕を生成するための要素技術として,残存文長を考慮したRNNよる逐次的な改行挿入手法を提案する.残存文長とは文の残りの長さを意味する.評価実験の結果,SVMを使用した従来手法よりも,F値が大幅に向上しており,本手法の有効性が確認された. |
E-035 |
出現頻度と周辺文脈に基づくツイート中の新語の検出
◎向井勇希・杉本 徹(芝浦工大)
×
E-035出現頻度と周辺文脈に基づくツイート中の新語の検出
◎向井勇希・杉本 徹(芝浦工大)
私たちは世相や流行に応じて新しい言葉を生み出し使用しているが、こうした言葉は形態素解析を必要とするシステムにおいて正しく処理できないことが多い。また新語は日々新たなものが生み出されており、辞書への正確かつ継続的な追加は困難である。本研究では、テキストから新語を自動的に検出する手法を考案した。まず、Twitter上の投稿からN-gramの集合を抽出し、出現頻度の高いものを新語の候補として抽出する。その上で、出現確率の時間的変化や出現文脈の特徴に基づいて候補を絞り込むことで辞書へ追加する候補を効率的に検出する。評価実験では収集した投稿に対して提案手法を適用し、4割から5割の精度で新語を抽出できた。 |
E-036 |
言語モデルと構文情報を用いた日本語文のボトムアップ語順整序
◎山添壮登・大野誠寛(電機大)・松原茂樹(名大)
×
E-036言語モデルと構文情報を用いた日本語文のボトムアップ語順整序
◎山添壮登・大野誠寛(電機大)・松原茂樹(名大)
日本語では,文法的には誤りではないものの読みにくい語順を持った文が生成される場合がある. そのため,読みやすい語順で文を生成する技術はテキスト推敲支援や文生成において重要な技術となる. 本稿では,言語モデルと,構文情報に基づく語順整序モデルとを統合し,日本語文を構成する文節の語順を読みやすく並べる手法を提案する. 本手法では,係り受け情報が既知という前提のもと,任意の受け文節に係る文節集合を適切な語順に並び替え,1文全体をボトムアップに語順整序する. |
自然言語処理(対話,画像と言語) |
8月26日(木) 15:30-17:30 5f会場
座長 吉野 幸一郎(理研)
座長補佐 西田 京介(NTT) |
E-037 |
検索画像を介在させた語から語の連想模擬法の検討
◎相馬佑哉・堀内靖雄・黒岩眞吾(千葉大)
×
E-037検索画像を介在させた語から語の連想模擬法の検討
◎相馬佑哉・堀内靖雄・黒岩眞吾(千葉大)
我々は人の連想のメカニズムの解明を目指し,語から語の連想模擬を検討している.本稿では,一つの刺激語から複数の連想語を回答するタスクを扱う.これまで,BERTを用いて言語情報のみを用いた連想模擬手法の検討を進めてきたが,人間は視覚情報に基づく連想も行っている.そこで本稿では,視覚情報として刺激語で検索した画像群から得られた色を利用した連想模擬を試みた.具体的には,BERTのMASKタスクで,MASKに連想語が出現する文を設定した上で,検索画像から抽出した色名をテキスト情報として加えた.その結果,言語情報のみを用いた場合と比較し,人間が上位に連想していた色を連想できるようになった. |
E-038 |
自己注意機構を用いた応答の対話行為推定
◎宮城孝明・遠藤聡志(琉球大)
×
E-038自己注意機構を用いた応答の対話行為推定
◎宮城孝明・遠藤聡志(琉球大)
対話行為は、発話者の発話の「意図」や「意味」を表し,対話生成や内容の理解に必要な情報である.田中らの研究では,Gated Recurrent Unit(以下,GRU)を用いた階層型深層学習モデルを使用し,応答の対話行為推定を行っている.しかし,GRUでは重要な単語の価値が他の単語の価値と同等になる事や,直近の発話同士を重点的に考慮されていない事が課題として考えられる.自己注意機構は,各入力トークン同士の関係性を直接学習できる.そのため,本研究では自己注意機構を用いた階層型深層学習モデルを提案する.具体的には,単語系列や発話系列を処理する箇所に自己注意機構を用いて,注意すべき箇所を考慮する.従来手法と比較した実験では,AccuracyとF値の向上を確認した. |
E-039 |
(講演取消) |
E-040 |
RNNに基づくEncoder-Decoderニューラル対話モデルにおける単語埋め込みベクトル・隠れ層ベクトルのノルムの変化の分析
◎冨岡愛也・加藤恒夫・田村晃裕(同志社大)
×
E-040RNNに基づくEncoder-Decoderニューラル対話モデルにおける単語埋め込みベクトル・隠れ層ベクトルのノルムの変化の分析
◎冨岡愛也・加藤恒夫・田村晃裕(同志社大)
Encoder-Decoder再帰型ニューラルネットワークを用いた非タスク指向型対話の応答生成技術においてエンコーダとデコーダへの入力は単語埋め込み層により多次元ベクトルに変換されて再帰層に入力される.これまでに単語埋め込みベクトルのノルムについて調査した結果,エンコーダは出現頻度,デコーダは次単語予測のエントロピーとの相関係数が高いことを確認した.本研究では注意機構付きEncoder-Decoderニューラル対話モデルにおける単語埋め込みベクトルと隠れ層ベクトルのノルムの変化について分析した.デコーダの再帰層には単語埋め込みベクトルと再帰層自体の一時刻前のベクトルと共に,エンコーダの隠れ層ベクトルが入力されるためそれらのノルムを測り,変化の様子を分析した. |
E-041 |
傾聴を示す応答を用いた語りの重要箇所の同定
◎小杉駿介・伊藤滉一朗(名大)・村田匡輝(豊田高専)・大野誠寛(電機大)・松原茂樹(名大)
×
E-041傾聴を示す応答を用いた語りの重要箇所の同定
◎小杉駿介・伊藤滉一朗(名大)・村田匡輝(豊田高専)・大野誠寛(電機大)・松原茂樹(名大)
語りには様々な知識が含まれるため,語りの内容を記録し参照できるようにすることは有意義である.本論文では,語りの要約生成を目的に,語りにおける重要箇所の同定手法を提案する.本手法では,語りの内容に加え,語りの聴衆が発声した傾聴応答の情報を用いる.傾聴応答とは,語りを傾聴していることを示す聞き手の反応であり,その出現は語りにおける内容上の重要性と関連している可能性がある.本論文では,傾聴応答の出現箇所と語りにおける重要箇所との関係について論じる.また,語りの重要箇所の同定における傾聴応答の利用の効果を実験的に検証する. |
E-042 |
対話要約における話者情報を持つEmbeddingの効果
◎楢木悠士・酒井哲也・林 良彦(早大)
×
E-042対話要約における話者情報を持つEmbeddingの効果
◎楢木悠士・酒井哲也・林 良彦(早大)
対話の自動要約においては,発話された内容を正確かつ簡潔に要約するだけでなく,発話者とその発話内容を正しく対応付ける必要があり,これが通常の文書要約との大きな違いである.本研究では,発話者のアイデンティティ情報を入力の埋め込み表現に埋め込むことにより,この課題を解決する.複数の埋め込み方法を実験的に比較したところ,位置埋め込み (position embedding) の情報性が乏しいと考えられる部分に話者情報を埋め込むことにより,生成される要約のROUGEスコアや人手評価が改善されることを確認した.特に,SAMSumデータセットにおいて,SOTAのROUGEスコアを達成することができた.さらに、生成要約の誤りの種類を分析し,提案手法の効果を具体的に説明する. |
自然言語処理(情報検索・推論) |
8月27日(金) 9:30-12:00 6d会場
座長 高橋 寬治(Sansan)
座長補佐 佐々木 稔(茨城大) |
E-043 |
弱教師学習による営業日報分析を用いたカタログ検索
◎加藤大羽・田中美智子(日立)
×
E-043弱教師学習による営業日報分析を用いたカタログ検索
◎加藤大羽・田中美智子(日立)
営業日報や企画書など大量の社内文書を二次活用し,業務効率化に活かす試みが広がっている。しかし,業務を通じて収集・蓄積された非構造のテキストデータを二次活用するためには,ドメイン知識を用いた構造データ化作業が必要であり,その工数削減が課題であった。我々は,弱教師学習を活用し,営業日報や製品カタログ文書を構造データ化する処理を工数削減した。また,この構造データを活用し,営業日報の内容を自動分析して,製品カタログの中から最適な製品をレコメンドする検索システムを開発した。本発表では,本検索システムで用いた弱教師学習による情報抽出および営業日報と製品カタログという異種文書間の情報連携手法について述べる。 |
E-044 |
BERTを用いた分類モデルによる冗長な質問文の要点抽出
○中山研一朗・正田備也(立教大)
×
E-044BERTを用いた分類モデルによる冗長な質問文の要点抽出
○中山研一朗・正田備也(立教大)
AIを用いたチャットボットが多くの企業で導入されているが、その多くが、事前に登録したFAQから、利用者が入力した質問に対応して最も類似したものを選択する分類モデルである。しかし、利用者はしばしば冗長な説明のついた質問を行うことがあり、分類精度を下げる要因となっている。本研究は、冗長な質問から疑問文のみを抽出するモデルを、日本語Wikipediaで事前訓練済みのBERTを用いて構築した。ファインチューニングには、ヤフー知恵袋のデータを用いることで、質問かそれ以外か分類するアノテーションを容易に取得した。ファインチューニングの結果、90%を超えるAccuracyを実現した。 |
E-045 |
中医学における分散表現を用いた情報検索手法
○太田遥人(仙台高専)・関 隆志(フジ虎ノ門整形外科病院)・高橋晶子・力武克彰(仙台高専)
×
E-045中医学における分散表現を用いた情報検索手法
○太田遥人(仙台高専)・関 隆志(フジ虎ノ門整形外科病院)・高橋晶子・力武克彰(仙台高専)
際疾病分類第 11 版(ICD-11)において新たに伝統医学の疾病分類が追加されるなど, 近年, 医療現場において中医学は補完代替医療としての需要が高まっている.診察から「証」と呼ばれる患者の状態を診断する過程で医師は「病態図」を作成する. これにより, 患者の症状全てを加味した診断が可能となり, 患者の状態が明確になる. しかし, 中医学は東アジア諸国で独自に発展したため, 国や医者, 文献によって証に関する症状や処方する生薬は異なる場合がある.そのため、中医学の診断には証と症状を結び付けるための多くの知識と経験が必要である. 従って, 適切な診断は熟達した医師でなければ困難であり, 中医学において診療経験の少ない医師の診断を支援する仕組みが必要である. そこで、本研究では、分散表現を利用し、症状から証を検索する情報検索システムを構築することにより、医師の診断を支援することを目的とする。 |
E-046 |
質問応答システムにおける各手法の性能比較 : BERTが必ずしも有利とならないケースについて
◎水口綾乃・市川 治(滋賀大)
×
E-046質問応答システムにおける各手法の性能比較 : BERTが必ずしも有利とならないケースについて
◎水口綾乃・市川 治(滋賀大)
学部オープンキャンパス用の質問応答システムを例にとり,質問分類精度を4手法により測定した.その結果,総合では事前学習済みのBERTをファインチューニングする方法が最も高い性能を示したが,個別の質問のクラスについては,事前学習モデルを使用しないWord Embeddingモデルの方が高い性能を示すクラスもあった.この現象は,似た2つの質問があった場合に,特定の単語が識別の重要なカギになっているケースで観察される.BERTを用いた質問応答システムを設計するにあたっては,このようなBERTの特性に注意して分類クラスを定義すべきである. |
E-047 |
共起を考慮した回帰分析による推理小説の犯人推定
◎勝島修平・穴田 一(東京都市大)
×
E-047共起を考慮した回帰分析による推理小説の犯人推定
◎勝島修平・穴田 一(東京都市大)
近年, 機械学習への社会的な期待が高まっている一方, 専門家でも推論過程に対して説明を与えられない解釈可能性が問題となっている. 既存研究では, トリプルによる犯人推定を行うために埋め込みに基づいた手法が提案されているが, 小説上の場所, 時間, 対象物などの同時性を考慮できていない. そこで本研究では, 穴埋め問題などで利用されるCBoWモデルを利用することで単語の共起に関する学習を行う. そして, 学習した共起情報を用いて回帰分析を行う事で推論過程の説明を試み,追加知識によって対象となる小説の犯人推定までの過程を追えることを確認した. |
E-048 |
ニューラルモデルとタブロー法を用いた自然言語推論
◎佐治礼仁・加藤芳秀・松原茂樹(名大)
×
E-048ニューラルモデルとタブロー法を用いた自然言語推論
◎佐治礼仁・加藤芳秀・松原茂樹(名大)
自然言語推論タスクにおいて,ニューラルモデルによるアプローチは高い性能を達成している. しかし,判定結果に至る過程や理由を説明する能力を有しておらず,内部がブラックボックスであるという問題がある. 本論文では,ニューラル自然言語推論モデルにおいて推論過程を明示できるようにするために,形式論理に基づく手法の一つであるタブロー法とニューラルモデルを組み合わせる手法を提案する. タブロー法は,推論ルールの適用に基づく論理式の分解,および,同一の論理式の肯定と否定の存在からの矛盾の検知から構成される. 提案手法ではこのうち,矛盾の検知においてニューラルモデルを用いる. |
自然言語処理(校正・感情推定) |
8月27日(金) 13:10-15:40 7e会場
座長 古宮 嘉那子(農工大)
座長補佐 成松 宏美(NTT) |
E-049 |
変更履歴に着目した機械学習による論文校正支援方法の考察
◎松井亮介(南山大)・渡辺開斗(インディーズゼロ)・蜂巣吉成・吉田 敦・桑原寛明(南山大)
×
E-049変更履歴に着目した機械学習による論文校正支援方法の考察
◎松井亮介(南山大)・渡辺開斗(インディーズゼロ)・蜂巣吉成・吉田 敦・桑原寛明(南山大)
1人の教員が複数の学生に対して論文の校正を行う際に、適切ではない表現に対して同じような指摘を繰り返し行う場合がある。本研究では、過去の学生の論文変更履歴から適切ではない表現を自動で抽出して校正を支援する方法について考察する。変更履歴から (1) 変更された文の対応づけ (2) 変更された形態素の比較による単語レベルの適切ではない表現の抽出 (3) 単語レベルでは見つからない文レベルの適切ではない表現の機械学習による抽出という3つの手順を提案する。変更履歴を利用することで、ルールベースの校正方法と違い、教員がルールを記述する必要がなく、変更履歴が増えるほど精度の向上も見込める。 |
E-050 |
上位概念語n-gramを用いた感情極性推定
◎納谷大智・吉見毅彦(龍谷大)
×
E-050上位概念語n-gramを用いた感情極性推定
◎納谷大智・吉見毅彦(龍谷大)
本研究では,従来の感情極性推定手法と異なり,クラスn-gramの考え方に基づいて上位概念語n-gramを新たに取り入れることで感情極性の推定精度が向上するかを検証した.従来手法では,感情極性推定のための素性として単語n-gramが用いられている.しかし,単語n-gramには,入力文に出現する単語間の類似性を考慮できないという問題がある. 検証の結果,シソーラスとしてEDR辞書を用いて変換した時,単語n-gramに基づく従来手法よりも提案手法の推定精度が有意に高いことを確認した. |
E-051 |
ゴルフ場推薦のためのコースレビュー分析
◎大和矢悠仁・大坪愛佳・ファティマ アルハビブ・高貴達之・蒲生奏衣・阿部遥佳・髙師 遥・鶴島仁人・延澤志保(東京都市大)
×
E-051ゴルフ場推薦のためのコースレビュー分析
◎大和矢悠仁・大坪愛佳・ファティマ アルハビブ・高貴達之・蒲生奏衣・阿部遥佳・髙師 遥・鶴島仁人・延澤志保(東京都市大)
本研究では,レビューデータにコースの特徴が表れると仮定し,これを活用したゴルフ場の推薦手法を検討する. 本稿では,レビュー評価点とコメント中の形容詞の関係性に着目し,レビュー評価点と形容詞の感情極性との相関について考察する. |
E-052 |
ソーシャルメディアおよびECサイトでのレビュー分析のための‘望’感情の抽出
◎瀬山透矢・ASTREMO AMILCARE・安達由洋(東洋大)
×
E-052ソーシャルメディアおよびECサイトでのレビュー分析のための‘望’感情の抽出
◎瀬山透矢・ASTREMO AMILCARE・安達由洋(東洋大)
我々は感情語辞書に基づいて日本語文の感情分析(分類と検索)を高速に行う感情表現分析システムを開発し発表している。ところで、ソーシャルメディアやECサイト上での商品・サービスに関するレビュー・クチコミから商品・サービスの改善点や新商品の希望などを記述した文を抽出できると非常に有用である。そこで、“望”感情カテゴリと、“望まれる”や“して欲しい”などのそのカテゴリに属する見出し語を感情語辞書に追加して、希望・要望を記述した文を抽出する機能を感情表現分析システムに追加実装した。本発表では、システムの機能概要と実際のレビューデータを用いた性能評価結果について報告する。 |
E-053 |
感情分析に基づくデマ検知アルゴリズムの開発
◎LIJING QU・成 凱(九産大)
×
E-053感情分析に基づくデマ検知アルゴリズムの開発
◎LIJING QU・成 凱(九産大)
SNS上で自由に発信された情報の中で人々に役立つ情報がありながら、政治的・利益的な意図を持って拡散されるデマ情報も含まれており、社会問題となって対策が求められている。デマ対策の一環として、デマ検知を素早く行う必要がある。デマの特徴は誇張した叙述手法で民衆を恐怖させ、焦慮させ、感情的な策略を用いて読者の感情を煽動するため、感情分析によってデマ検知を効果的に行えると期待される。デマ検知に関する既存の研究では、機械学習を採用して、結果はデータセットに依存する場合が多い。また、感情分析をデマ検知への応用はまだ成熟ではないという問題点が知られている。そこで、本研究では、感情分析のテキスト感情の極性と感情の強度を基づくデマ検知アルゴリズムを開発する。 |
E-054 |
絵文字を用いて自動生成した感情コーパスの有効性について
◎浅野晴暉・松原雅文(岩手県大)
×
E-054絵文字を用いて自動生成した感情コーパスの有効性について
◎浅野晴暉・松原雅文(岩手県大)
近年,テキストから感情状態を機械的に識別する,感情分析の研究が盛んに行われている. しかし,喜・怒・哀・楽といった多種の感情を分析する手法では,利用可能な言語資源が非常に少ないため機械学習に必要となる教師データの作成コストが問題となっている. 近年では絵文字をもとに教師データを自動構築し上記の問題点を緩和する手法が存在するが,感情ラベルを生成する際に感情のカテゴリや値が主観的になってしまう問題点が存在する. そこで,本稿では絵文字と言語の共起関係を基に適切な感情ラベルを自動生成する手法を行い,作成した感情コーパスの有効性を検証する. |