E分野 自然言語・音声・音楽 |
選奨セッション 自然言語 |
9月6日(水) 9:30-12:00 1e会場
座長 萩行 正嗣(株式会社ウェザーニューズ)
吉野 幸一郎(理化学研究所) |
CE-001 |
カウンセリング内容の機械学習を用いた分類
◎山口 匠・中道 万優子・馬場 隆寛(久留米工業大学)
×
CE-001カウンセリング内容の機械学習を用いた分類
◎山口 匠・中道 万優子・馬場 隆寛(久留米工業大学)
近年では、うつ病などの精神疾患は大きな社会問題となっており、早期発見が課題となっている。そのため、悩みを気軽に相談できるように窓口やウェブサイトなどが多く存在する。しかし、相談件数が非常に多いのに対して、カウンセラーの数には限りがあり素早い対応が難しいのが現状である。加えて、悩みを相談する人達がカウンセラーからの返答があるまで類似した内容を幾度も投稿し続けることがあった。そこで、本研究では相談内容に対して、機械学習を用いてタグ付けを行う手法を提案する。これにより、相談内容に応じたカウンセラーへの割り振りが容易になり、労力の軽減につながることが期待できる。 |
CE-002 |
(講演取消) |
CE-003 |
災害発生時のクロノロジーに対する優先度推定
◎孝壽 真治・竹内 孔一(岡山大学)・渡邉 暁洋(兵庫医科大学)・平山 隆浩・中尾 博之(岡山大学)
×
CE-003災害発生時のクロノロジーに対する優先度推定
◎孝壽 真治・竹内 孔一(岡山大学)・渡邉 暁洋(兵庫医科大学)・平山 隆浩・中尾 博之(岡山大学)
災害発生時には災害対策本部が設置され,各地の医療機関などから報告や要請などの情報が集められる。その際に情報の整理を目的として、時間、発信者、受信者、報告された情報や指示の内容をまとめたクロノロジーと呼ばれるものが作成される。災害対策本部ではクロノロジーを基に、職員が対応の必要な案件とその優先度を判断して、連携機関に指示を出す。しかし、クロノロジーは膨大な量があり、人命に関わるような優先度が高いものと、単なる報告のような優先度が低いものが存在するため、職員が優先度を適切に判断するのは非常に難しい。そこで本研究ではクロノロジーに対して機械学習を用いて、その優先度を推定するモデルの構築を行う。 |
CE-004 |
大規模言語モデルにおける暗黙の推論生成能力の評価
◎根岸 直生(東北大学)・坂口 慶祐・乾 健太郎(東北大学/理化学研究所)
×
CE-004大規模言語モデルにおける暗黙の推論生成能力の評価
◎根岸 直生(東北大学)・坂口 慶祐・乾 健太郎(東北大学/理化学研究所)
暗黙の推論とは与えられた論証テキスト中の主張・前提間の隔たりを埋める推論であり,暗黙の推論を行う能力は日常の,あるいはディベートの論証等への理解に必要な能力である. 自然言語処理では言語モデルによる暗黙の推論のためのデータセットやモデルがこれまで提案されてきた. 本研究では近年の大規模言語モデルの急速な発展をうけ,大規模言語モデルによる暗黙の推論の妥当性についてクラウドソーシングを用いて評価を行った. 実験の結果,人手によるアノテーションと同等かそれを上回る評価を全体で得たが,主張と前提に明確で形式的な因果関係が無い場合に妥当な推論を行えない傾向が見られた. 暗黙の推論に関するベンチマークは設計が非常に難しく,しかし人間と同等の推論能力を持つ人工知能の実現に向けて極めて重要である.今回の評価に関するデータをコミュニティに提供することで,後続の研究にて新たな発見や知見を得られることを期待する. |
CE-005 |
超短編小説のフリオチパターンの分類とオチの自動生成
◎大島 一海・小川 浩平・佐藤 理史(名古屋大学)
×
CE-005超短編小説のフリオチパターンの分類とオチの自動生成
◎大島 一海・小川 浩平・佐藤 理史(名古屋大学)
2、3文で構成される超短編小説「54字の物語」には、典型的なフリオチ構造が存在する。 720件の物語を人手でフリとオチに分割した後、類似するものを整理し、最終的に 12種類 の特徴的なフリオチパターンを設定した。これらのパターンは、720件の物語のうちの約 半数をカバーする。フリとオチに分割した物語224件を使って大規模言語モデルGPT-2を ファインチューニングし、フリを入力してオチを生成できるかを調べた。その結果、面白 いオチを少数ながら生成できること、多様な内容・パターンのオチを生成できることを確 認した。 |
CE-006 |
複数レビューのアスペクトベースセンチメント分析に基づくアスペクト毎の要約文の生成
◎辻谷 千春・渥美 雅保(創価大学)
×
CE-006複数レビューのアスペクトベースセンチメント分析に基づくアスペクト毎の要約文の生成
◎辻谷 千春・渥美 雅保(創価大学)
本論文では,アスペクトベースセンチメント分析と生成要約を組み合わせて,レビューをアスペクトカテゴリとセンチメント極性毎に要約する手法を提案する.本手法では,まず,アスペクトベースセンチメント分析の結果を用いてレビュー文を分類する.次に,アスペクトカテゴリとセンチメント極性毎のレビュー文群を対象として,大規模言語モデルへの要約の観点に沿ったプロンプト入力に基づいて要約文を生成する.SemEval2016レストランデータセットを用いた実験を通じて,要約のアスペクトセンチメント極性への適合性,及び観点を様々に変えたときの要約の観点適合性を評価して,本手法の有効性を確認する. |
CE-007 |
(講演取消) |
選奨セッション 音声・音楽 |
9月6日(水) 13:10-15:10 2e会場
座長 酒向 慎司(名古屋工業大学)
橋本 佳(名古屋工業大学) |
CE-008 |
マルチモーダルTransformerエンコーダに基づく音声とテキストに含まれる複数感情の認識の評価
◎仁平 正彦・渥美 雅保(創価大学)
×
CE-008マルチモーダルTransformerエンコーダに基づく音声とテキストに含まれる複数感情の認識の評価
◎仁平 正彦・渥美 雅保(創価大学)
複数のモダリティを用いたマルチモーダル感情表現認識では,各モダリティを融合する手法やデータセットの不足などの課題が存在する.本研究では,音声のWav2vec 2.0によるエンコーディングと音声認識モデルWhisperによる文字起こしテキストのRoBERTaによるエンコーディングを入力とする音声・テキスト特徴間のクロスモーダルアテンションTransformer に基づく感情表現認識モデルを提案している.本論では,音声のセグメントごとに異なる感情ラベルを含む小規模データセットを作成し,音声データに含まれる複数の感情表現を分割して処理する合議性のもとで,感情が現れる句を適切に識別可能か検証する. |
CE-009 |
聴覚過敏を有する自閉スペクトラム症者の音声に対する主観的経験を予測するモデルの支援への応用に向けた分析
○市川 樹(国立障害者リハビリテーションセンター研究所)・長井 志江・國吉 康夫(東京大学)・和田 真(国立障害者リハビリテーションセンター研究所)
×
CE-009聴覚過敏を有する自閉スペクトラム症者の音声に対する主観的経験を予測するモデルの支援への応用に向けた分析
○市川 樹(国立障害者リハビリテーションセンター研究所)・長井 志江・國吉 康夫(東京大学)・和田 真(国立障害者リハビリテーションセンター研究所)
自閉スペクトラム症(ASD)の当事者の多くは、特定の音に対し強いストレスを感じるなど聴覚過敏の問題から生活上の困難を持つ.発表者はこれまでASD当事者の音声に対する主観的経験が本来の音声からどう変化しているかのデータを収集し,音声から生じる主観的経験変化を予測する機械学習モデルを開発してきた.本論文ではモデルの当事者支援への応用に向けた実験・分析として,(1)音声特徴量および当事者自身のコンディションの主観的経験変化への寄与率の算出,(2)音声特徴量・主観的経験変化間の関係性のクラスタリング,(3)音刺激を当事者自ら緩和できたらどう変化させるかに関する実験の結果,について報告する. |
CE-010 |
ピアノ宿題練習システムのための音特徴量による生徒演奏の構成音ミスおよびタイミングミスAI分類
○細田 真道(NTT東日本)・内山 匡(NTT-AT)・小林 丈之(NTT東日本)・笹生 恵理・大川 耀平(東音企画)・福田 成康(ピティナ)・夏川 勝行(NTT東日本)
×
CE-010ピアノ宿題練習システムのための音特徴量による生徒演奏の構成音ミスおよびタイミングミスAI分類
○細田 真道(NTT東日本)・内山 匡(NTT-AT)・小林 丈之(NTT東日本)・笹生 恵理・大川 耀平(東音企画)・福田 成康(ピティナ)・夏川 勝行(NTT東日本)
ピアノ教室の宿題である,指導者不在の自宅練習における生徒演奏を判定し,演奏に応じてアドバイスするhiketaシステム実現を目指している.多くの生徒が利用するにはMIDI非対応のアコースティックピアノで譜面台にスマートフォン/タブレット端末を置いただけの環境が望ましい.これまで端末で録音した生徒演奏と,予め登録した模範演奏および複数の想定した構成音ミス演奏との,スペクトログラム同士をそれぞれDTW距離計算し,比較することで構成音ミス判定できた.本稿では打鍵間隔の比較を追加しタイミングミスを判定する方式を提案する.そして有効性を確かめるため複数の環境における演奏を判定する評価実験を実施する. |
CE-011 |
楽曲メディアコンテンツを対象としたコード特徴を用いた複雑性抽出方式
◎杉山 彩子・岡田 龍太郎・峰松 彩子・中西 崇文(武蔵野大学)
×
CE-011楽曲メディアコンテンツを対象としたコード特徴を用いた複雑性抽出方式
◎杉山 彩子・岡田 龍太郎・峰松 彩子・中西 崇文(武蔵野大学)
本稿では,楽曲メディアコンテンツを対象としたコード特徴を用いた複雑性抽出方式について示す.本研究では人が楽曲に対して複雑性を判断する要因としてコード特徴に着目し,コードチェンジの頻度,コード単体の複雑さ,コードがダイアニックコードに含まれているかの3つから複雑度を定義する.本方式は対象とする楽曲メディアコンテンツのコード進行,それぞれのコードの拍数,キーの3つを入力とし,それらから楽曲の複雑度を抽出することを可能とする.本方式を実現することにより,コード特徴の観点から楽曲の複雑性について比較することを可能とする.これによって,複雑度を用いてユーザの好みに合った楽曲を選択するシステムを構成することができる.本研究の検証として異なる楽曲間の比較および同一楽曲の異なるアレンジの比較実験を行う. |
CE-012 |
GTTMに基づくメロディレンダリング法
○浜中 雅俊(理化学研究所)
×
CE-012GTTMに基づくメロディレンダリング法
○浜中 雅俊(理化学研究所)
GTTM分析で得られるタイムスパン木を用いると,メロディ中で装飾的な音符を 削減し構造的に本質的な音符を残すメロディの簡約が可能である.メロディレンダリング法は,簡約の逆のプロセスで,音符が付いていないタイムスパン木に音符を追加する処理である.それを実現するため我々は,タイムスパン木の枝の優先度を定義し,メロディの逐次簡約を行う.そして逐次簡約後を入力,逐次簡約前を出力として自動翻訳で学習したところ逐次レンダリングが学習可能であることを確認した.実験では,タイムスパン木の根元の枝の音符以外をすべて取り払ったものに対し逐次簡約によりレンダリングを行ったところすべての曲でレンダリングが可能であった. |
自然言語処理(ソーシャルメディア) |
9月6日(水) 13:10-15:10 2d会場
座長 竹内 孔一(岡山大学) |
E-001 |
攻撃的文章判定を用いた不適切文章の訂正
◎吉田 基信・松本 和幸・吉田 稔(徳島大学)
×
E-001攻撃的文章判定を用いた不適切文章の訂正
◎吉田 基信・松本 和幸・吉田 稔(徳島大学)
本研究では、攻撃的な文章を分類モデルにより検出し、攻撃性を抑制した文章に訂正する手法を提案する。攻撃的文章の検出器には、人手により攻撃性の有無をタグ付けしたテキストデータを準備し、BERTで学習させた分類モデルを用いる。文章の訂正には、大規模言語モデルであるGPTおよびBERTをファインチューニングした変換モデルを用いる。この変換モデルは、人手により作成した訂正例のデータを用いて適切な文章を生成するように事前学習を行い、最適化したものである。提案手法による文章訂正結果を、ファインチューニングしていない大規模言語モデルによる結果と比較することにより、妥当性を確認する。 |
E-002 |
A Design of Multimodal Learner Corpus for Practical Foreign-language Communication
○小谷 克則(関西外国語大学)・吉見 毅彦(龍谷大学)
×
E-002A Design of Multimodal Learner Corpus for Practical Foreign-language Communication
○小谷 克則(関西外国語大学)・吉見 毅彦(龍谷大学)
This paper presents a design of a multimodal interpreting learner corpus as a resource for foreign language learning/teaching. This corpus is designed to cover practical foreign-language communication including community interpreting for local and non-local language speakers, as a goal of foreign language learning in social globalization. It is also designed to capture nonverbal behaviors such as facial expressions, gestures, and postures by parsing these behaviors into the distribution of body-parts’ landmarks. This paper explores the usefulness of a learner corpus in analyzing the language learning process, particularly, the significant effects of nonverbal behaviors to communication in a foreign language. |
E-003 |
文意系列を考慮したコールセンターオペレータの発話の文意予測
◎川北 海斗・今井 貴史・市川 治(滋賀大学)
×
E-003文意系列を考慮したコールセンターオペレータの発話の文意予測
◎川北 海斗・今井 貴史・市川 治(滋賀大学)
コールセンターオペレータの発話の書き起こしテキストを入力とし、それをあらかじめ定義された文意クラスに分類する機械学習モデルを構築する。さらに連続する複数発話の文意系列を考慮した推定を行い、精度向上を図る。 |
E-004 |
ソーシャルメディアにおける発話の攻撃性推定に向けたデータセット構築
◎藤原 知樹・伊藤 彰則・能勢 隆(東北大学)
×
E-004ソーシャルメディアにおける発話の攻撃性推定に向けたデータセット構築
◎藤原 知樹・伊藤 彰則・能勢 隆(東北大学)
日常会話において何気ない発言が発言者の意図とは異なる受け取られ方をして、結果的に相手を傷つけてしまうことや会話が円滑に進まなくなることがある。本研究では、SNSを対象としたそのようなコミュニケーションエラーの解消を目的に、人や文脈によっては攻撃的に受け取られる可能性があるグレーゾーンの発話を検出して会話を補助するシステムの実現を目指す。本実験では、攻撃的な発話や無害な発話とグレーゾーンの発話を区別できるモデルの実現に向けて、発話の攻撃性を細かく評価したデータセットを構築する。またグレーゾーンの発話を効率よく収集するために、NGワードを用いた収集手法と攻撃検出モデルを用いた3種類の収集手法を比較する。 |
E-005 |
主観的幸福度のリアルタイム推定のためのGoogle TrendsおよびTwitterデータの併用アプローチ
◎佐伯 凌(アイヴィス)・湯浅 晃(NTTデータ)
×
E-005主観的幸福度のリアルタイム推定のためのGoogle TrendsおよびTwitterデータの併用アプローチ
◎佐伯 凌(アイヴィス)・湯浅 晃(NTTデータ)
世界の主観的幸福度の調査においては統計データや一部アンケート調査が用いられており、実施頻度やリアルタイム性において課題がある。そこで本稿では解決策としてリアルタイムに情報が得られるデータソースとしてGoogle TrendsとTwitterデータを併用した推定手法を提案する。提案手法を用いた結果、2010-2020年の期間、6カ国における主観的幸福度の推定において、ベースラインとした経済指標のみを使用した手法を上回る推定精度が得られた。考察の結果、経済指標には表現されない家庭、教育、生活等の状態をあらわす特徴量が推定精度向上に寄与していると考えられ、主観的幸福度の推定におけるこれらのデータの有効性を確認した。 |
自然言語処理(文脈解析・言語資源) |
9月6日(水) 15:30-17:30 3d会場
座長 小川 浩平(名古屋大学) |
E-006 |
再帰構造を用いた事前学習済み言語モデルの長文への対応
○斎藤 大貴・全 炳東(千葉大学)
×
E-006再帰構造を用いた事前学習済み言語モデルの長文への対応
○斎藤 大貴・全 炳東(千葉大学)
言語モデルに入力可能なトークン数を増やすことは小説やプログラム、連続した対話など長文を扱うドメインにおいて一貫性のある出力を得るために有効である。一方で、言語モデルは大規模になるほど学習コストが増加するため、有効な手法であっても再学習するにはコストが大きいという課題もある。本研究では既存の言語モデルを低コストな微調整のみで長文に対応させることを目的とし、再帰構造を取り入れることを提案する。実験ではBERTをBlock Recurrent Transformersで提案された再帰構造に拡張し、下流タスクにおける微調整によって精度の変化を確かめる。Arxiv論文のカテゴリ分類タスクでは再帰構造に拡張する前のBERTと比較し、提案手法では僅かに精度が向上した。 |
E-007 |
日本語の日常対話コーパスの構築に向けた小説テキストの分析
◎岩本 和真・安藤 一秋(香川大学)
×
E-007日本語の日常対話コーパスの構築に向けた小説テキストの分析
◎岩本 和真・安藤 一秋(香川大学)
本研究では,利用者投稿型の小説テキストを用いて,日本語日常対話コーパスの自動構築を目的とする.小説には複数の登場人物の台詞が存在しており,それらの台詞対は対話とみなすことができる.また,小説は創作物であるが,ジャンルによっては日常生活で使われる自然な対話が存在していると考えられる.さらに,投稿される小説の数は日々増加しており,これらを活用することで大規模なコーパスを低コストで自動構築できる可能性がある.そこで本稿では,日本語の小説を用いて日常対話コーパスを構築するための初期検討として,小説内の台詞数や語彙数などの分析を通じて,オンライン小説の対話コーパスとしての可能性を確認する. |
E-008 |
ブラウザ上でユーザが編集可能な言語パターンマッチシステムの構築
◎桂 辰弥・竹内 孔一(岡山大学)
×
E-008ブラウザ上でユーザが編集可能な言語パターンマッチシステムの構築
◎桂 辰弥・竹内 孔一(岡山大学)
テキスト中の特定の表現を見つけることは,言語および教育分野において必要となることがある.例えば語学学習におけるコンコーダンサなどがある.本研究ではユーザ自身が求める表現を検索ブロックで組み合わせてシステムに投入し,事例を検索できるシステムの開発を行っている.先行研究においてJavaScriptとPythonを利用した基本システムを構築したが,システムの本格利用にはいくつかの課題が残されている.そこで本報告では検索エンジンの中心部分であるPrologデータベースの実装の改良,および,大規模なテキストが扱えるためにデータベースをシステムに導入したので,この改良について報告する. |
E-009 |
品詞のパターンマッチングを用いた帝国議会議事速記録における可能表現の自動抽出
◎北野 勇太・横山 想一郎・山下 倫央・川村 秀憲・伊藤 孝行(北海道大学)
×
E-009品詞のパターンマッチングを用いた帝国議会議事速記録における可能表現の自動抽出
◎北野 勇太・横山 想一郎・山下 倫央・川村 秀憲・伊藤 孝行(北海道大学)
本研究は,57年間にわたる帝国議会議事速記録の口語対話の分析を通じて,議会における議員の可能表現の使用状況の変遷を明らかにすることを目指す.可能表現は,議員が自身の主張を述べる際に頻繁に使用する表現で,議会というこれまでの日本社会には存在しなかった文脈において,大きな影響を受けていると推察される.本研究では,速記録データを形態素に分割し,文章中の品詞と従来研究における9つの可能表現の区分とのパターンマッチングを適用する手法を開発する.さらに,テキスト化された帝国議会秘密会速記録のデータセットを用いて,開発した抽出手法の精度を検証して,その有用性を示す. |
E-010 |
若者言葉を含む文の逆翻訳に関する一考察
◎眞柄 圭佑(東京都市大学)・王 嘉慧(東京都市大学/大連交通大学)・カリサ ティファニー・延澤 志保(東京都市大学)
×
E-010若者言葉を含む文の逆翻訳に関する一考察
◎眞柄 圭佑(東京都市大学)・王 嘉慧(東京都市大学/大連交通大学)・カリサ ティファニー・延澤 志保(東京都市大学)
本研究では,若者言葉を含む文について,原文と翻訳文,逆翻訳文の関係について調査した. 若者言葉を含む文について,英訳後の英文と逆翻訳後の原言語の文の若者言葉の訳語部分をそれぞれ原文と比較したところ,逆翻訳後の訳語が適切な場合であっても英訳が適切でない場合が見られた. これについて検討を行い,逆翻訳についての特徴を考察する. |
自然言語処理(言語モデル) |
9月6日(水) 15:30-17:30 3e会場
座長 吉田 稔(徳島大学) |
E-011 |
日本語不均衡データに対してのChatGPTを利用したかさ増し手法の提案
◎澤崎 夏希・遠藤 聡志(琉球大学)
×
E-011日本語不均衡データに対してのChatGPTを利用したかさ増し手法の提案
◎澤崎 夏希・遠藤 聡志(琉球大学)
大規模データの利用が進み、様々な分類問題が解決されているが、不均衡なデータの扱いには多くの課題がある。データが不均衡な場合、少量カテゴリに対して新たなデータをアノテーションすることが望ましいが、実際には少量カテゴリの類似データを生成する、かさ増し手法が用いられる。自然言語のかさ増し手法は課題が多く、有効な手法が確立されていなかったが、ChatGPTを用いたかさ増しが英語に対して有効であることが示された。そこで、本研究ではlivedoorニュースコーパスに対して、ChatGPTを用いたアノテーションとかさ増しを行い、精度変化の比較から、日本語不均衡データに対してのChatGPT有効性を示す。 |
E-012 |
事前学習済みBERTモデルの語彙の追加を伴う伝統医学分野への適用と評価
◎伊藤 元斗(仙台高等専門学校)・関 隆志(フジ虎ノ門整形外科病院)・高橋 晶子・力武 克彰(仙台高等専門学校)
×
E-012事前学習済みBERTモデルの語彙の追加を伴う伝統医学分野への適用と評価
◎伊藤 元斗(仙台高等専門学校)・関 隆志(フジ虎ノ門整形外科病院)・高橋 晶子・力武 克彰(仙台高等専門学校)
WHOが定めるICD-11に伝統医学の分類が追加されるなど、伝統医学への期待が高まっており、特に補完医療としての注目が集まっている。 本研究では、日本語の伝統医学文献を用いた事前学習済みモデルを作成することにより、自然言語処理技術のBERTを伝統医学分野へ適用させることを目指す。 伝統医学文献からの情報と、事前学習済みの日本語BERTモデルを用い、比較的低コストで伝統医学分野に適用させることを試みる。 追加事前学習や様々な語彙の追加手法を用い複数の事前学習済みモデルを作成して、 分類問題を解くファインチューニングを行って性能を評価し、学習時の条件や語彙の追加手法の比較を行う。 |
E-013 |
Sentence-BERTを用いた非タスク指向型対話応答の話題・文脈に関する整合性評価
◎寺内 祐希・加藤 恒夫・田村 晃裕(同志社大学)・橋本 真幸(東洋大学)・古舞 千暁・池田 和史(KDDI総合研究所)
×
E-013Sentence-BERTを用いた非タスク指向型対話応答の話題・文脈に関する整合性評価
◎寺内 祐希・加藤 恒夫・田村 晃裕(同志社大学)・橋本 真幸(東洋大学)・古舞 千暁・池田 和史(KDDI総合研究所)
非タスク指向型対話システムの対話応答は本質的に多様であり,その品質の自動評価は容易ではない.これまでに大規模言語モデルを活用するFEDなど評価手法が提案されているが,特に対話文脈の整合性の自動評価は難しい.本稿では,話題の整合性と対話文脈の整合性の2軸に着目し,人手による評価に近い自動評価を目指した.具体的には,良質な文章ベクトルを生成するモデルであるSentence-BERTを対話データで学習することで対話応答を4種に分類する評価器を試作した.クラウドソーシングで収集した主観評価値との一致度を測った結果,4種分類のF値マクロ平均が,ベースラインであるChatGPTの分類精度を上回った. |
E-014 |
Using fiction to enhance topic-specific conversation generation
◎Lin Jiancheng・Huang Chao ・Qiao Gang・Liu Xinyi・Liu Paiming・Zhan Zhenpeng(China Baidu International Technology Shenzhen Co.)
×
E-014Using fiction to enhance topic-specific conversation generation
◎Lin Jiancheng・Huang Chao ・Qiao Gang・Liu Xinyi・Liu Paiming・Zhan Zhenpeng(China Baidu International Technology Shenzhen Co.)
In recent years, open-domain dialogue systems have made very remarkable achievements in the era of big data and big models. However, building a topic-specific dialogue system still faces the problem that high-quality dialogue is difficult to collect. This paper proposes a method for enhancing dialogue generation effects using fiction to address this problem. Our method uses fictional texts on relevant topics, constructs the text data into single-party dialogue , and finetunes the model after mixing it with multi-party dialogue corpus. In this paper, we selected the theme of "gender relations", which is a less publicized corpus, for the experiment.According to our experiments, the method can effectively enhance the triggering rate of the model into the topic as well as the information of the model responses without destroying the original dialogue capability. |
音声・音楽 |
9月7日(木) 9:30-12:00 4d会場
座長 齋藤 大輔(東京大学) |
E-015 |
A proposal for a voice conversion method using MelGAN-VC and TTS voices for listening practice of second-language learners
◎森 清忠・三好 康夫・岡本 竜(高知大学)
×
E-015A proposal for a voice conversion method using MelGAN-VC and TTS voices for listening practice of second-language learners
◎森 清忠・三好 康夫・岡本 竜(高知大学)
We propose a voice converter using MelGAN-VC which uses TTS voices generated by Amazon Polly as a training dataset. The source and target data consist of American English TTS voices and Japanese-accented ones defined as phoneme replacements, respectively. It is because this paper describes two preliminary experiments to focus on listening practice for Japanese ESL learners. The first experiment is to confirm Amazon Polly's Japanese-accented English speech is clear for Japanese learners. The second is to confirm MelGAN-VC which uses these data can convert American speech to Japanese-accented speech. |
E-016 |
大規模事前学習モデルとデータ拡張による音声・食行動音同時認識
◎小祝 和寛(静岡大学)・緒方 淳(産業技術総合研究所)・西田 昌史・西村 雅史(静岡大学)
×
E-016大規模事前学習モデルとデータ拡張による音声・食行動音同時認識
◎小祝 和寛(静岡大学)・緒方 淳(産業技術総合研究所)・西田 昌史・西村 雅史(静岡大学)
高齢者の健康維持において重要とされる「話す」「食べる」といった機能を効率的にモニタリングするうえで,耳下装着の皮膚接触型マイクは音声と食事音をこの一つのデバイスで全て同時に認識できる有効な手段になりうると考えている.これまでに大規模事前学習モデルを用いて音声と食事音を同時認識するうえで食事音の認識率が低いことが問題であった.このような観点から,今回我々はデータ拡張手法を食事音に適用し,耳下マイクによって収録された音声と食事音の同時認識における性能改善について検証した. |
E-017 |
(講演取消) |
E-018 |
CycleGANと倍音の特徴を用いた微小時間ごとの音源分離手法の検討
◎川﨑 優生奈・田村 仁(日本工業大学)
×
E-018CycleGANと倍音の特徴を用いた微小時間ごとの音源分離手法の検討
◎川﨑 優生奈・田村 仁(日本工業大学)
ある曲のデータから特定の楽器音や人間の声を分離することを音源分離と呼び、音源分離ではバンドを対象にした研究が多く行われている。そこで、木管アンサンブルに焦点を当てて1つの楽器を分離させることを目的とし、それぞれCycleGANと倍音の特徴を用いたスペクトログラムの画像処理を2手法提案した。しかし、1つの楽器を分離できたとは言い難く、特にCycleGANの手法ではスペクトログラムを加工せずに用いたことから情報量に問題があると考えた。そこで、本研究ではスペクトログラムを1行ずつ取り出して学習、変換させる方法を提案する。これにより細部の変換を可能にすることが期待される。詳細は発表で述べる。 |
E-019 |
(講演取消) |
E-020 |
はみがきを楽しく適切に行うための楽曲の自動生成
◎荻原 彩果・大谷 紀子(東京都市大学)
×
E-020はみがきを楽しく適切に行うための楽曲の自動生成
◎荻原 彩果・大谷 紀子(東京都市大学)
日常生活の中で習慣化されている作業は,何度も繰り返されることで,手順を意識せずに行動できるようになる.しかし,手順を意識しない場合,次第に適切な手段から離れることが考えられる.また,長期間にわたり繰り返し行われるため,退屈に感じることが懸念される. 退屈を解消する1つの手法として,楽曲を聴きながら作業をすることが挙げられる. 現在,個人の感性を反映した楽曲の自動生成に関する研究が進められているが、楽曲再生中のユーザの行動を考慮していない. 本研究では,習慣化された作業を,楽しく適切な手段で行うことのサポートを目的とし,日常の作業と個人の感性に即した楽曲を自動生成する手法を提案する.本研究では,はみがきを対象とする. |
E-021 |
購入意欲向上を目指した心穏やかになる歌詞の仕掛けの分析
◎倉本 凌・島川 博光(立命館大学)
×
E-021購入意欲向上を目指した心穏やかになる歌詞の仕掛けの分析
◎倉本 凌・島川 博光(立命館大学)
本研究は、CM楽曲の歌詞設定が購買層に与える効果を解明する。滋賀県には、「心を穏やかにする」がモチーフの地酒の蔵元がある。広告等で心穏やかになるものを顧客に与えることで、この地酒の購買意欲を上げたい。今回は心穏やかになる歌詞を作りたい。そこで、本研究では人が心穏やかになる語や言い回しを分析する。心を穏やかにする、異なる歌詞をいくつか用意し、同じ曲のメロディにのせて歌ったものを、それぞれ被験者に聴いてもらう。被験者のセンサーのデータとインタビューの結果を分析することで、心穏やかになる歌詞設定を推定する。また、推定した設定を用いた歌詞を生成することで、購買意欲を向上できるかを調査する。 |
自然言語処理(感情分析/生成) |
9月7日(木) 9:30-12:00 4e会場
座長 堂坂 浩二(秋田県立大学) |
E-022 |
系列変換タスクにおけるChatGPTの日本語生成能力の評価
◎樽本 空宙・畠垣 光希・宮田 莉奈・梶原 智之・二宮 崇(愛媛大学)
×
E-022系列変換タスクにおけるChatGPTの日本語生成能力の評価
◎樽本 空宙・畠垣 光希・宮田 莉奈・梶原 智之・二宮 崇(愛媛大学)
本論文では、系列変換タスクにおいてChatGPTの日本語生成能力を評価する。ChatGPTは対話向けに調整された大規模言語モデルであり、英語の生成能力は先行研究によって定量的に評価されている。しかし、日本語におけるChatGPTの性能評価はまだ十分に行われていない。本稿では、系列変換タスクのうち機械翻訳、自動要約、テキスト平易化タスクにおいて、既存の教師あり手法とChatGPTの性能を比較評価した結果を報告する。 |
E-023 |
(講演取消) |
E-024 |
対話システムに任意のスタイルを付与する生成ベースのスタイル制御手法の提案
◎京江 遼大・打矢 隆弘・内匠 逸(名古屋工業大学)
×
E-024対話システムに任意のスタイルを付与する生成ベースのスタイル制御手法の提案
◎京江 遼大・打矢 隆弘・内匠 逸(名古屋工業大学)
近年,対話システムが普及し,単に人間の対話相手になるだけでなく,人間のように多種多様なスタイルを持って対話そのものを目的とする高度な対話システムの需要が高まっている.しかし,このような対話システムでは自然な対話を実現するために,スタイルが一貫した応答文生成が重要である.そのため,対話システムの開発者が意図したスタイルを応答文に簡単かつ自由に付与する仕組みが必要である.そこで,本研究では文面に現れる一人称・三人称や語尾・方言などが話者ごとに異なると仮定し,話者の特徴的な話し方をスタイルと定義する.深層学習を活用したスタイル変換を用いて,スタイルが一貫した応答文生成を実行する対話システムのスタイル制御手法を提案する. |
E-025 |
スタイル変換による雑談対話システムへのキャラクタ性の付与
◎近藤 里咲・梶川 怜恩・梶原 智之・二宮 崇(愛媛大学)
×
E-025スタイル変換による雑談対話システムへのキャラクタ性の付与
◎近藤 里咲・梶川 怜恩・梶原 智之・二宮 崇(愛媛大学)
本研究では、応答生成とスタイル変換を組み合わせたパイプラインモデルによって、雑談対話システムにキャラクタ性を付与する。先行研究では、転移学習や強化学習によってキャラクタ性を付与しているが、これらの手法は追加学習が可能な応答生成モデルに対してしか適用できない。提案手法の応答生成モデルには、fine-tuningできないサイズのモデルやブラックボックスモデルも扱うことができるため、近年の大規模言語モデルの恩恵を受けることができる。スタイル変換モデルは、対象キャラの発話にノイズを付与し、それを復元する訓練を通して構築する。ご当地キャラの対話データにおける実験の結果、提案手法の有効性を確認できた。 |
E-026 |
漫画の機械翻訳における吹き出しよりも長い文脈情報の活用
◎戒能 大翔・梶原 智之・二宮 崇(愛媛大学)・Tanner Joshua・石渡 祥之佑(Mantra)
×
E-026漫画の機械翻訳における吹き出しよりも長い文脈情報の活用
◎戒能 大翔・梶原 智之・二宮 崇(愛媛大学)・Tanner Joshua・石渡 祥之佑(Mantra)
本研究では、日本語の漫画からの英語への機械翻訳に取り組む。漫画の吹き出しは、単体では翻訳のために充分な情報を持たない。そのため先行研究では、前の吹き出しや対応するコマの画像など、文脈から情報を補う手法が提案されている。本研究では、より広い文脈情報を捉えるために、新たに2つの手法を提案する。ひとつは、前のコマを考慮するコマ単位の機械翻訳の手法である。もうひとつは、作品や作者、漫画のジャンルなどの情報を広義の文脈情報として考慮する手法である。実験を通して、それぞれの提案手法によって翻訳品質が改善され、これらの組み合わせによって最高品質が達成されることを確認した。 |
自然言語処理(検索・文体変換) |
9月7日(木) 15:30-17:30 5e会場
座長 萩行 正嗣(株式会社ウェザーニューズ) |
E-027 |
機械学習による接客語生成の研究
◎岡田 祐花・黒木 櫻子・来住 伸子(津田塾大学)
×
E-027機械学習による接客語生成の研究
◎岡田 祐花・黒木 櫻子・来住 伸子(津田塾大学)
日本語には「接客表現」というものが存在する。接客表現は様々な種類があり、間違えやすい。例えば、「ご注文は以上でよろしいでしょうか。」という言葉がある。「ご注文は以上ですか。」や、「ご注文は以上でよろしかったでしょうか。」は、意味としては「ご注文は以上でよろしいでしょうか。」と同様の意味である。しかし、接客表現として不適切である。 このような背景から、学生が適切な接客表現を簡単に学習できるシステムの開発を目指した。本研究では、用例ベース方式と生成ベース方式の2つの方式で接客表現を生成するチャットボットを作成し、ユーザーによる比較評価を行なった。 |
E-028 |
タイトルのうろ覚えを許容する書籍検索
◎池田 桃果・伊東 嗣功・石井 雅樹・堂坂 浩二(秋田県立大学)
×
E-028タイトルのうろ覚えを許容する書籍検索
◎池田 桃果・伊東 嗣功・石井 雅樹・堂坂 浩二(秋田県立大学)
本研究では,あいまい検索の手法の開発を狙いとして,図書館で提供されているレファレンスサービスの事例を利用し,書籍タイトルでのあいまい検索手法の開発を目的とする.単語の意味を定量化するfastTextモデルと,意味の近さを計ることのできるコサイン類似度を用いて書籍を検索するシステムを構築する.そして入力をうろ覚えのタイトル,出力を書籍のタイトルとして,提案手法と従来手法,Google検索とBM25との比較を行った.結果として,提案手法は従来手法の正解率を下回った.特に,正解タイトルにサブタイトルなどが付与されている場合や,うろ覚えタイトルに正解タイトル中の単語が含まれている場合にBM25より正解率が低くなることが分かった. |
E-029 |
A Study on Teen Slang Translation of Asian Languages
◎Carissa Tiffany(Tokyo City University)・Wang JiaHui(Tokyo City University/Dalian Jiaotong University)・Thammapatee Suravich(Mahidol University)・Magara Keisuke(Tokyo City University)・Harisadee Pasin・Seinglek Sivakorn(Sirindhorn International Institute of Technology, Thammasat University)・Nobesawa Shiho(Tokyo City University)
×
E-029A Study on Teen Slang Translation of Asian Languages
◎Carissa Tiffany(Tokyo City University)・Wang JiaHui(Tokyo City University/Dalian Jiaotong University)・Thammapatee Suravich(Mahidol University)・Magara Keisuke(Tokyo City University)・Harisadee Pasin・Seinglek Sivakorn(Sirindhorn International Institute of Technology, Thammasat University)・Nobesawa Shiho(Tokyo City University)
This study discusses the results of an analysis of the translation of young people's words by existing translators for Asian languages. |
E-030 |
機械学習を用いた日本語文体の自動変換について
◎安野 俊也・三好 力(龍谷大学)
×
E-030機械学習を用いた日本語文体の自動変換について
◎安野 俊也・三好 力(龍谷大学)
自然言語は品詞や文法など様々な要素によって構成されている。 特に日本語では状況や立場に合わせて使い分けられることが多い。 しかし、機械翻訳などの2言語間の変換を行う研究はされているが、同一言語内での常体から敬体など文体の変換はあまり研究されていない。 さらに、機械翻訳や文体変換においては翻訳元と翻訳先のペアになっているデータが必要であるが、それを大量に用意することは難しいという問題も存在する。 そこで、本稿では機械学習によって画像変換を行う手法を応用し、文体変換を実現する手法について検討する。 |
E-031 |
researchmapの情報を用いた異なる研究分野間の研究者マッチングの試み
◎前多 陸玖・廣吉 和貴・木村 泰知(小樽商科大学)
×
E-031researchmapの情報を用いた異なる研究分野間の研究者マッチングの試み
◎前多 陸玖・廣吉 和貴・木村 泰知(小樽商科大学)
本研究では,異なる分野の研究者の連携を促進する方法として,researchmapに掲載されている論文タイトルを用いて,研究者の興味関心のある分野を推定し,興味関心の近い研究者を提示することを目的とする. 具体的には,大学を超えて類似度が高い論文を書いている研究者を見つけることができるのかを調べ,分野を超えたマッチングが可能かどうかを明らかにする. 実験では,北海道国立大学機構として統合された商学の小樽商科大学,農学の帯広畜産大学,工学の北見工業大学に所属する研究者を対象として,評価を行う. |
自然言語処理(応用) |
9月8日(金) 9:30-12:00 6d会場
座長 小川 泰弘(名古屋市立大学) |
E-032 |
TOPIX100の有価証券報告書の表を対象としたChatGPTによるPDFからJSONへの自動変換の試み
◎佐藤 栄作・木村 泰知(小樽商科大学)
×
E-032TOPIX100の有価証券報告書の表を対象としたChatGPTによるPDFからJSONへの自動変換の試み
◎佐藤 栄作・木村 泰知(小樽商科大学)
本研究では,ChatGPTを用いて,PDFからJSON形式への自動変換がどの程度可能であるかを明らかにする. 本実験では,TOPIX100に属する企業の有価証券報告書のPDFに含まれる表を対象として,JSONへの自動変換の性能評価を行う. 有価証券報告書は,PDFファイルとして公開されるとともに,XMLベースのXBRL形式でも公開されている. XBRLファイルには,財務情報の表に対してタクソノミ(要素の定義)とインスタンス(数値など)が記述されている. 性能評価では,XBRLから抽出したJSONを正解データとして,ChatGPTによって抽出したJSONに対する自動評価を行う. |
E-033 |
「食材toVec」を用いた食材推薦とレシピ生成の提案
◎加藤 翔大(滋賀大学)・神田 竜之介(滋賀大学(卒業))・市川 治(滋賀大学)
×
E-033「食材toVec」を用いた食材推薦とレシピ生成の提案
◎加藤 翔大(滋賀大学)・神田 竜之介(滋賀大学(卒業))・市川 治(滋賀大学)
本研究では、レシピデータの食材リストだけで学習したWord2Vecモデルを食材toVecモデルと呼ぶ。食材toVecは、食材の共起関係だけを反映した食材のベクトルとなっている。このモデルを用いた食材推薦とレシピ生成の手法を提案する。 |
E-034 |
対話グループ推定における音源放射方向の有効性
◎小川 広夢・高橋 徹(大阪産業大学)
×
E-034対話グループ推定における音源放射方向の有効性
◎小川 広夢・高橋 徹(大阪産業大学)
我々は、複数の話者が滞在する音環境において、各話者が所属する 対話グループを推定する問題について述べる。特に、話者の位置と 発話方向が与えられた時に、方向情報が、対話グループ推定に有効 であることをシミュレーション実験により示した。対話グループを 話者の位置情報のみから推定する方法と、話者の位置および方向か ら推定する方法を比較し、方向情報の有効性を確認した。位置誤差 と方向誤差を統合には、近似を導入し、K-meansクラスタリングに 帰着させた、セントロイド更新式を導き出した。 |
E-035 |
うつ病の早期検知に向けたブログデータの分析
◎中野 遼河・安藤 一秋(香川大学)
×
E-035うつ病の早期検知に向けたブログデータの分析
◎中野 遼河・安藤 一秋(香川大学)
本研究では,ブログ記事の内容からブログ著者のうつ病の兆候を早期に発見する技術の実現を目的とする.本研究では,うつ病診断前のブログ記事には,早期検知に有効な素性が埋もれていると仮定し,うつ病診断前とうつ病診断後の双方のブログ記事に注目する.本稿では,事前検討として,それぞれの記事の特徴を比較・分析する.分析の結果,うつ病の早期検出に役立つと思われる特徴として,うつ病の症状と考えられる単語の利用,現実と乖離するような内容記述,断定的な表現を避けた記述,そして,自分のうつ病の症状の正体がわからないため,症状を比喩で表現する傾向などが確認できた. |
E-036 |
Sentence-BERTの文ベクトルにおける色表現の構造についての調査
◎泉 諒音・神野 健哉(東京都市大学)
×
E-036Sentence-BERTの文ベクトルにおける色表現の構造についての調査
◎泉 諒音・神野 健哉(東京都市大学)
本論文では,「色+の+車名」という文章に対応する画像を出力する画像生成モデルを用いて,潜在変数空間における色の関係を調査した.特に,このモデルを用いて異なる車種の色の関係を調べたところ,潜在変数空間における色の位置が車種間で類似していることがわかった.そこで,ある車種において代表点としてRGB色の3点を抽出し平面を作成した.この平面上で潜在変数を変化させた場合,車の形は変わらず色のみが変化することを確認した.よって潜在変数空間の中には車種を表している平面があると考えられる.本論文は,潜在変数空間における色と色の関係について考察し,自然言語処理モデルにおける色表現の構造に焦点を当てている. |
自然言語処理(テキストマイニング) |
9月8日(金) 13:10-15:40 7e会場
座長 木村 泰知(小樽商科大学) |
E-037 |
社内文書からビジネスドメインの知識グラフを構築する手法の検討
○HOANG LE ANH・齋藤 靖二・鈴木 健太郎・佐野 恵一(東芝)
×
E-037社内文書からビジネスドメインの知識グラフを構築する手法の検討
○HOANG LE ANH・齋藤 靖二・鈴木 健太郎・佐野 恵一(東芝)
企業において、社内検索プラットフォームを活用し、社内の知識と情報を蓄積・共有・検索することは業務効率向上に有用である。さらに、ユーザーが欲しい情報に早くたどり着く手段として、検索のパーソナライズ化や文書管理の効率化を図ることを考え、知識グラフの構築・活用を検討している。本研究では、オントロジーと自然言語処理の技術を活用し、社内文書からビジネスドメインの知識グラフを構築する手法を開発した。また、本手法により知識グラフを試作し、文書との関連度に基づいてノード(単語)とエッジ(単語間関係性)の抽出精度を評価し、検索効率化の有効性を検証した。 |
E-038 |
知識グラフを用いた社内情報検索システムの検討
○齋藤 靖二・HOANG LE ANH・佐野 恵一・鈴木 健一郎(東芝)
×
E-038知識グラフを用いた社内情報検索システムの検討
○齋藤 靖二・HOANG LE ANH・佐野 恵一・鈴木 健一郎(東芝)
企業における業務効率化として、情報蓄積と必要な情報に早くたどり着く社内検索プラットフォームは非常に有用である。蓄積した知識情報を社内実務で活用するため、ユーザーが入力した検索ワードに一致する記事だけでなく、関連する特徴語を含んだ記事を見つけられるように機能拡張を検討している。本研究では、記事から抽出した特徴語と各記事を紐付けた知識グラフにより、関連文書を検索するシステムを開発した。本システムでは、キーワード全文検索だけでは取得出来ない関連記事の抽出や、システム側から推奨提示した特徴語を使った記事の絞込みができることを確認した。 |
E-039 |
ユーザーから評価されるスマホアプリレビューの予測手法
◎古波津 巧真・太田 修平・石井 信明(神奈川大学)
×
E-039ユーザーから評価されるスマホアプリレビューの予測手法
◎古波津 巧真・太田 修平・石井 信明(神奈川大学)
スマホアプリのプラットフォームにおいて,ユーザーは参考になったレビューを評価することができる.ユーザーは,参考数が多いレビューを参照し,インストールおよび,アップデートの際により良い選択ができる.しかし比較的新しいレビューは,スマホアプリの最新情報を含んではいるが,参考数が付与されておらず,良い情報を含んでいるか判断できない.本研究では,レビュー内容を加味して,レビュー投稿30日後のレビュー参考数の有無を予測する方法を提案する.ユーザー未評価のレビューからユーザーに将来参照される可能性の高いレビューを検出することで,ユーザーは,早い段階で価値の高いレビューに基づく判断ができる. |
E-040 |
医療事故報告書に対するテキストマイニングシステム
◎松村 崇光・竹内 孔一(岡山大学)
×
E-040医療事故報告書に対するテキストマイニングシステム
◎松村 崇光・竹内 孔一(岡山大学)
岡山大学病院を含む医療施設ではインシデントレポートが大量に保管されている.インシデントレポートとは医療ミスにつながる出来事の報告書のことである.今までそれらを有効的に活用できていない.これらのインシデントレポートを有効的に活用できれば,今後の医療に大きく役立つ知見を得られると考える.よって,これらのデータを有効的に活用するためのテキストマイニングシステムが必要である.そこで本研究ではインシデントレポートから重要な情報や関連性を見つける手助けをするテキストマイニングシステムの構築を行う.テキスト検索やデータのグラフ表示などの基本的な機能から係り受け解析による頻度表示や共起語表示などの新たな情報の発見を手助けするような専門の機能を実装する.本報告書では,システムの設計及び実装を行った後,動作確認実験を行い,構築したシステムについて考察する. |