E分野 自然言語・音声・音楽 |
選奨セッション ⾃然⾔語処理(NL) |
9月4日(水) 9:30-12:00 1d会場
座長 須藤 克仁(奈良女子大学)
佐藤 敏紀(ソフトバンク株式会社) |
CE-001 |
テキストデータの極性判定における気象情報の影響の調査
◎山口 匠(久留米工業大学)・中道 万優子(所属なし)・馬場 隆寛(久留米工業大学)
×
CE-001テキストデータの極性判定における気象情報の影響の調査
◎山口 匠(久留米工業大学)・中道 万優子(所属なし)・馬場 隆寛(久留米工業大学)
本論文では、私たちの身近な存在であるSNSと天候に注目した。2月19日から3月12日までの期間、久留米市役所から半径20kmのXのコメントと久留米市の気象情報(気温・降水量・蒸気圧・相対湿度・日照時間・風速) を収集し、テキストデータのみと気象データを組み合わせた2つのデータセットを作成した。それらのデータセットを使用して、教師あり学習を行い正解率から感情予測性能を調査する。結果、気象データを組み合わせたデータセットの性能が2.5 %高いことが明らかになった。次に、使用している6 種類の気象情報の組み合わせ計63 通りの中で最も予測性能の高いものを調査した。結果は最も性能が高いものが「気温・風速」、低いものが「日照時間」となった。 |
CE-002 |
事例ベースNERを用いた中古日本語文のニューラル機械翻訳
◎中城 裕之・福原 義久(武蔵野大学)
×
CE-002事例ベースNERを用いた中古日本語文のニューラル機械翻訳
◎中城 裕之・福原 義久(武蔵野大学)
本論文では、事例ベース固有表現抽出を用いた中古日本語文からの固有表現抽出とそれを活用したニューラル機械翻訳システムを提案する。中古日本語文とは日本語の発展段階の一つであり、主に平安時代中期に用いられたものである。これらはデータ化された資料に乏しく、近年研究が進む深層学習を用いた自然言語処理分野の中ではやや遅れを取っている。提案手法では少量のデータでも十分な性能を発揮できるFew-shot学習を用いた事例ベース固有表現抽出を中古日本語文に適用し、ニューラル機械翻訳システムを用いてその効果を検証する。 |
CE-003 |
AIとアイデアユニットを活用した日本語学習者向け近代文学多読教材作成手法の研究:樋口一葉「たけくらべ」を例とした言語的調整による汎用的変換アプローチ
○甘利 実乃(東京外国語大学)
×
CE-003AIとアイデアユニットを活用した日本語学習者向け近代文学多読教材作成手法の研究:樋口一葉「たけくらべ」を例とした言語的調整による汎用的変換アプローチ
○甘利 実乃(東京外国語大学)
本研究では、AIとアイデアユニット(IU)を活用した日本語学習者向け近代文学多読教材の作成手法を提案する。IUを「1つ以上の主語と述語を含む、意味的にまとまりのある最小の文構造」と定義し、原文をIUに分割する。そして、学習者のレベルに応じて、IU内の語彙・文法・文型などを言語的に調整し、原文を参照しながら文章を再構築することで、多読用教材を作成する。本手法の有効性を検証するため、樋口一葉の「たけくらべ」を例に、IUの抽出と言語的調整を行う。また、文化的背景の理解を促進するため、オノマトペのイラスト化なども補助的に活用する。本研究は、AIを用いた日本語学習者向け教材作成の新たな可能性を提示する。 |
CE-004 |
EC市場における中古品のユーザ需要に関するテキストマイニング解析
◎伊集院 大将・石垣 綾(東京理科大学)
×
CE-004EC市場における中古品のユーザ需要に関するテキストマイニング解析
◎伊集院 大将・石垣 綾(東京理科大学)
近年において,資源枯渇は世界的に深刻な問題の1つになっている。資源枯渇を防ぐためには,中古品と販売するリユース市場の規模拡大が不可欠である。EC(Electric Commerce)サイトでは,古品の取引が行われる一方,これらの中古品はユーザの需要を正確に反映していないことがある。 本研究では,ECサイト上の中古品の購入者のレビューに対してテキストマイニング解析を行う。まず,購入者のレビューを形態素解析し,中古品に対してユーザ需要を示す単語を明らかにする。次に,それらの単語に対して共起ネットワークを作成し,単語ごとの関連を示す。最後に,ユーザ需要を示す単語が中古品の説明にどれぐらい含まれているかを検証する。 |
CE-005 |
日本語形容表現における多義性の検出と分析
◎大澤 拓巳・寺岡 丈博(拓殖大学)
×
CE-005日本語形容表現における多義性の検出と分析
◎大澤 拓巳・寺岡 丈博(拓殖大学)
日常の会話や文章の中で,物事の性質や状態,そして感情などの表現には様々な形容詞や形容動詞が使用されている.そのような形容表現には語義が一意でないものが存在しており,活用の幅は多種多様である.加えて,時代の変化に伴い語義が増減しているものもあり,自動でこれらの語義の違いを高い精度で認識するのは困難である. 本研究ではSentence BERT(SBERT)を用いて,日本語形容表現の多義性を自動検出する.評価実験では,先行研究手法をベースラインとし,提案手法との比較を行い,高い精度を確認した.また,これらの多義性について分析した結果,文の類似度が多義性に関わっていることを明らかにした. |
選奨セッション 音声・音楽 |
9月4日(水) 13:10-15:10 2d会場
座長 酒向 慎司(名古屋工業大学)
梅村 祥之(広島工業大学) |
CE-006 |
モーラ長に基づく話者モデルを用いた音声仮名化
◎伊藤 葵・伊藤 克亘(法政大学)
×
CE-006モーラ長に基づく話者モデルを用いた音声仮名化
◎伊藤 葵・伊藤 克亘(法政大学)
発話者の特定を防ぎ、プライバシー保護を目指す音声匿名化では、主流な方法の一つにx-vectorを用いた声色変換による話者秘匿がある。しかし、これらの手法では韻律上に表れる個人性を秘匿できず、話速に依存する話し方の癖から発話者の特定に繋がる恐れがある。本稿では、モーラ長に基づく話者モデルを用いた日本語音声の仮名化手法を提案する。提案手法では、日本語音声データを用いて、モーラ長を入力とする話者照合モデルを学習し、モデルから韻律に基づく特徴量を取得する。得られたモーラ長に基づく特徴量を変換することで、時間的特徴に対する個人性の秘匿化を提案する。 |
CE-007 |
拡散モデルと倍音の特徴を用いた音源分離手法の検討
◎川﨑 優生奈・田村 仁(日本工業大学)
×
CE-007拡散モデルと倍音の特徴を用いた音源分離手法の検討
◎川﨑 優生奈・田村 仁(日本工業大学)
ある曲のデータから特定の楽器音や人間の声を分離することを音源分離と呼び、音源分離ではバンドを対象にした研究が多く行われている。そこで、木管アンサンブルに焦点を当てて1つの楽器を分離させることを目的とし、それぞれCycleGANと倍音の特徴を用いたスペクトログラムの画像処理を2手法提案した。しかし、1つの楽器を分離できたとは言い難く、特にCycleGANの手法では分離させる楽器の特徴を捉えられていない結果となった。そこで、本研究では拡散モデルを用いてスペクトログラムを加工する方法を提案する。スペクトログラムを1列ずつ取り出して学習、変換し、性能を確かめる。詳細は発表で述べる。 |
CE-008 |
RAVEを用いた稀少楽器音色を利用するための二段式楽器音色変換法
◎胡 棣・伊藤 克亘(法政大学)
×
CE-008RAVEを用いた稀少楽器音色を利用するための二段式楽器音色変換法
◎胡 棣・伊藤 克亘(法政大学)
この論文では、「RAVE(Realtime Audio Variational autoencoder)」を使用した二段階の楽器音色変換手法に焦点を当てています。この手法の主な利点は、トレーニングデータが不足している状況でも、目標音色と中間過渡音色の変換モデルをトレーニングすることで、目標音色に対する音質の向上が期待できる点です。また、目標音色への変換を二段階に分けることで、より効果的な変換が可能となります。 この手法では、異なる中間音色変換モデルを同時にトレーニングすることで、音色の類似性と変換効果の関係について深く理解することができます。異なるアプローチやモデルの組み合わせが、最終的な変換結果にどのような影響を与えるかを調査することが重要です。このアプローチは、音色変換技術の進化と最適化に寄与する可能性があります。 |
CE-009 |
音色に着目した自然音の楽器分類評価システム
◎オウ イクカン・伊藤 克亘(法政大学)
×
CE-009音色に着目した自然音の楽器分類評価システム
◎オウ イクカン・伊藤 克亘(法政大学)
音楽制作において、自然音の魅惑的な領域を探求することは、しばしばユニークな困難を伴う。様々な量の水を満たしたグラスでメロディーを奏でるシンプルさは魅力的だが、他の自然音でそのような多様性を再現するのは難しい。ほとんどの自然音は、グラスのようなピッチ変調の自由度がないため、均質性や複雑性が生じ、音楽への直接的な応用には適さない。本稿では、AI技術を活用した評価手法を提案する。本手法では、自然音のデータセットを利用してディープニューラルネットワークモデルを学習し、音の特徴ベクトルを抽出する。その後、これらの特徴を楽器単音データセットに適用し、楽器の領域における自然音の次元のモデリングを可能にする。分類モデルを通して、得られた特徴は自然音と楽器の比較を容易にし、楽器としての自然音の適性についての洞察を提供する。本研究では、カウベルのような自然音をマリンバのような伝統的な楽器と比較して評価する方法を示している。 |
CE-010 |
ピアノ教室のレッスンを補完する宿題練習支援システムの実証実験におけるAI採点の評価
○細田 真道・小林 丈之(NTT東日本)・本村 愛眞・笹生 恵理・福田 優子(東音企画)・福田 成康(ピティナ音楽研究所/慶應義塾大学)・夏川 勝行(NTT東日本)
×
CE-010ピアノ教室のレッスンを補完する宿題練習支援システムの実証実験におけるAI採点の評価
○細田 真道・小林 丈之(NTT東日本)・本村 愛眞・笹生 恵理・福田 優子(東音企画)・福田 成康(ピティナ音楽研究所/慶應義塾大学)・夏川 勝行(NTT東日本)
ピアノ指導者の存在を前提として教室でのレッスンを補完するため,生徒自宅での宿題練習を支援するhiketa(仮称)システムの実証実験を行い,搭載するピアノAI採点を評価する.小学校入学前後の生徒は譜読み能力が不十分で,指導者不在の自宅では間違いに気づかずに宿題練習してしまい,教室でのレッスン時間が間違い修正に費やされることが多い.AI採点を用いた宿題練習支援で演奏の間違いを指摘することにより,こうした生徒が次回レッスンまでに譜読みでき,指導者は表情付けなどの音楽的指導に専念できるようになる.生徒・指導者あわせて100名を超える約半年にわたる実証実験によりAI採点がピアノ上達に資することを示す. |
選奨セッション 言語理解とコミュニケーション(NLC) |
9月4日(水) 15:30-17:30 3d会場
座長 石野 亜耶(広島経済大学)
吉田 光男(筑波大学) |
CE-011 |
質問コーパスを利用した疑問詞の推定とその効果
◎千野 愛実花・寺岡 丈博(拓殖大学)
×
CE-011質問コーパスを利用した疑問詞の推定とその効果
◎千野 愛実花・寺岡 丈博(拓殖大学)
近年,大規模言語モデルによる自然言語処理技術の発展に伴い,対話システムの高精度化に関心が高まっているが,非タスク指向型対話については対話継続などの課題が依然として残っている.人間同士の対話において,話題の導入には質問と応答を繰り返すことが求められるため,本研究では,この過程に着目し,質問に使われる疑問詞を推定する.ここでは,既存の対話コーパスから質問とそれまでの対話履歴を発話ターンの長さごとに抽出し,質問コーパスとしてまとめている.その情報を利用して対話履歴から次の発話(質問)に必要となる疑問詞を推定する.評価実験では,推定された疑問詞を利用して質問を生成することで,提案手法の効果を確認した. |
CE-012 |
ChatGPTと楽観性理論の交錯:楽観性の逐語的内容分析に基づいた自然言語処理の評価
○髙橋 潤(東京都立大学)
×
CE-012ChatGPTと楽観性理論の交錯:楽観性の逐語的内容分析に基づいた自然言語処理の評価
○髙橋 潤(東京都立大学)
本研究では,自然言語処理(NLP)の進展を背景に大規模言語モデル(LLM)を用いた対話型AIシステムの文脈解釈能力を評価した.実験では,個人の楽観性を体系的に評価することを目的として,ChatGPTによる文章の楽観性解釈と心理学的理論であるSeligmanの説明スタイルに基づく楽観性の逐語的内容分析(CAVE)を比較した.結果として,英文ではChatGPTがCAVEに基づいた楽観性の解釈と正の相関を示す(r >= 0.73)ことが明らかになった.AI技術を活用した楽観性分析は,組織活動の健全性を向上させる心理的安全性や自己効力感などに肯定的な影響を与える重要な洞察を提供する. |
CE-013 |
ChatGPTを用いた記事の構成要素を加味する長文文章生成手法の提案
◎澤崎 夏希・遠藤 聡志(琉球大学)
×
CE-013ChatGPTを用いた記事の構成要素を加味する長文文章生成手法の提案
◎澤崎 夏希・遠藤 聡志(琉球大学)
Large Language Model(LLM)の発展により,従来人手で行われていたタスクの自動化が進められている.特に,自然言語におけるかさ増しは従来手法では困難であったため,LLMを用いたかさ増し手法が確立されつつある.一方で,多くのかさ増し手法は英語かつ短文に対して行われており,日本語の長文生成についての報告は少ない.理由として,出力トークン長の制限や,チャットを前提にチューニングが行われていることがあげられる.そこで,本研究では,記事データから抽象化した構造を加味することで長文の記事データのかさ増しを行い,語彙数や文長などの比較によりLLMによる長文生成手法の有効性を検証する. |
CE-014 |
RAG(Retrieval-Augmented Generation)技術を応用した保育業務支援ツール
◎岡田 怜士(東洋大学)・冨島 悠介(所属なし)・丸山 桃子・満永 拓邦(東洋大学)
×
CE-014RAG(Retrieval-Augmented Generation)技術を応用した保育業務支援ツール
◎岡田 怜士(東洋大学)・冨島 悠介(所属なし)・丸山 桃子・満永 拓邦(東洋大学)
近年、保育施設などの子育て関連事業者の過重な労働が問題視されており、保育士の負担軽減のためにデジタル技術を活用した「保育DX」の推進の必要性が高まっている。 そこで本研究では保育の計画に関する業務に着目し、情報技術を活用した支援ツールの作成を検討した。具体的には、LLM(Learge Language Model)やRAG(Retrieval-Augmented Generation)を用いることで乳児の指導計画を生成するツールを作成し、保育士の作業効率の向上及び業務負担の軽減の手法を提案する。 |
CE-015 |
大規模言語モデルを適用した交渉自動対話システムへのマネージャーの導入
◎渡邉 賢・藤田 桂英(東京農工大学)
×
CE-015大規模言語モデルを適用した交渉自動対話システムへのマネージャーの導入
◎渡邉 賢・藤田 桂英(東京農工大学)
交渉は社会生活において重要でありながら,その複雑さから両者にとって納得のいく結論で合意することが困難である.そこで自動交渉エージェントの導入によってその困難を克服する試みがなされている.また,自然言語処理の分野では,大規模言語モデル(LLM)がその性能の高さから注目を集めている.本研究では,自然言語で交渉を行う自動交渉エージェント(交渉自動対話システム)にLLMを適用し,マネージャーを導入し,ファインチューニングを実施する手法を提案する.実験から,マネージャーの導入は利益最大化と合意形成確率向上に,LLMの適用は自然な発話の実現に,ファインチューニングは正確性の向上に効果があることが示された. |
CE-016 |
対話の忘却とペルソナの圧縮により対話文とSNS情報から個性を獲得する対話エージェント
◎近藤 一希・佐久間 拓人・加藤 昇平(名古屋工業大学)
×
CE-016対話の忘却とペルソナの圧縮により対話文とSNS情報から個性を獲得する対話エージェント
◎近藤 一希・佐久間 拓人・加藤 昇平(名古屋工業大学)
近年AIとの対話が日常的になりつつある. 話者の情報を短文で表現するペルソナを用いて,既存のチャットAIの課題であった一貫性を向上させた研究が存在する. 加えて,エージェントに個性を獲得させることで親密性の向上が期待される. 本研究ではユーザの個性を反映するため,発話文からペルソナを更新するSNS情報を背景とした対話エージェントを提案する. さらに,ペルソナを圧縮することでペルソナの追加による個性の過剰な強化を抑制し,3往復以前の対話履歴を消去することで過去の対話の影響による話題の偏りを緩和する. 5件法を用いた実験の結果,親密性や語彙性の項目で比較手法と比べ高い平均スコアを得た. |
⾃然⾔語処理(NL) 1 |
9月4日(水) 13:10-15:10 2c会場
座長 佐藤敏紀(ソフトバンク株式会社) |
E-001 |
ChatGPTを用いたJavaプログラミングエラーメッセージの学習者向け解説の生成
◎岡田 祐花・来住 伸子・中野 美由紀(津田塾大学)
×
E-001ChatGPTを用いたJavaプログラミングエラーメッセージの学習者向け解説の生成
◎岡田 祐花・来住 伸子・中野 美由紀(津田塾大学)
プログラミング学習者が,コンパイラエラーや実行エラーなどのプログラミングエラーメッセージ(PEM)の意味を理解することは難しいことがある.そこで,PEMの解説をChatGPT を用いて生成することを検討した.対象とするプログラミング言語はJavaとし,学習者が書くことが多い,エラーのあるプログラムを作成した.これらのプログラムと,コンパイラまたはJVMが生成するPEMを,プロンプトともに,ChatGPTに入力した.プロンプトを複数使用することにより,PEMの解説を複数パターン生成した.プログラミング経験者が複数パターンの解説を読み,適切性や正当性などの比較検討を行った. |
E-002 |
文から単語への言い換え手法の提案
◎榎並 龍大・杉本 徹(芝浦工業大学)
×
E-002文から単語への言い換え手法の提案
◎榎並 龍大・杉本 徹(芝浦工業大学)
本研究では、文から単語への言い換えを行う手法を提案する。具体的には、SentenceBERTをはじめとした5つの類似度計算手法とそれらのアンサンブルによる計6つの手法を提案する。単語の語義説明文を入力とし、用意した4000単語を言い換え先として相応しい順にソートする。ソートした結果をMRR(Mean Reciprocal Rank)などで評価し、提案手法の考察を行った。 |
E-003 |
外国人を対象とした日本語の助詞の習得における個人の誤り傾向に応じた問題文の生成
○蔡 宇鋒・望月 久稔(大阪教育大学)
×
E-003外国人を対象とした日本語の助詞の習得における個人の誤り傾向に応じた問題文の生成
○蔡 宇鋒・望月 久稔(大阪教育大学)
日本語を学習する外国人にとって助詞の反復練習は重要であり,学習用の問題文を生成する研究は有益である.さらに学習者ごとの特徴を考慮する研究は重要である.そこで個人の誤りの傾向に応じて助詞の問題文を生成する.まず,個人の誤った助詞を練習する回数を定義するために,全学習者と個人の誤用した確率に基づいて誤った助詞の重要度を計算する.次に,誤った助詞を含む文と正解をデータセットから抽出し,その助詞を省略した文を問題文として重要度に基づき生成する.生成した問題文が個人の誤り傾向に応じた割合を調べるために,問題文に含まれる各助詞の割合と個人の誤用した確率を用いて評価する. |
E-004 |
オープンソースLLMを利用した学習アドバイジングの検証
◎釣部 勇人・上野 春毅(公立千歳科学技術大学)・長谷川 理(武蔵野大学)・小松川 浩(公立千歳科学技術大学)
×
E-004オープンソースLLMを利用した学習アドバイジングの検証
◎釣部 勇人・上野 春毅(公立千歳科学技術大学)・長谷川 理(武蔵野大学)・小松川 浩(公立千歳科学技術大学)
本研究では、クローズドLLMに比べて小中規模なパラメータをもつオープンソースLLMを用い、学習履歴情報に基づく学習アドバイジングが可能かを検証する。これまでに、大規模なパラメータを持つクローズドLLMを活用し学習アドバイジングを行ってきた。これに対し、近年カスタマイズ性や機密性、透明性の観点からオープンソースLLMの活用が注目されている。そこで本研究では、学習アドバイジングにおいてクローズドLLMをオープンソースLLMに置き換えた際に生成結果にどの程度変化がみられるかを比較する。生成結果の比較は、学習者特性に着目しアドバイス内容と学習者特性に基づくクラスタリング結果との合致度を用いる。 |
E-005 |
日本語文中における意味的に重複した語句の検出手法の検討
◎衣川 和尭・美野 秀弥・河合 吉彦(NHK放送技術研究所)
×
E-005日本語文中における意味的に重複した語句の検出手法の検討
◎衣川 和尭・美野 秀弥・河合 吉彦(NHK放送技術研究所)
文中に意味が重複している語句が含まれていると文章の簡潔性が損なわれる可能性があるため、これを自動で検出することで人間の執筆作業の支援が期待できる。意味的に重複した語句の自動検出技術の研究開発の課題として、こうした語句を含む文が高頻度な事例ではなく、かつ、文法的にも明確に誤りとはいえないため、データセットを構築することが難しいことが挙げられる。本研究では日英対訳データが近似的な意味を持つ文ペアで構成されていることを利用し、日本語文・英語文を注意深く比較することで日本語文中に意味的な重複を含むデータを確保する。このデータに対して大規模言語モデルによる自動検出精度を評価し、この課題を議論する。 |
⾃然⾔語処理(NL) 2 |
9月4日(水) 15:30-17:30 3g会場
座長 内海 慶(SB Intuitions) |
E-006 |
トークナイズ手法が日本語 word similarity タスクに及ぼす影響について
◎山口 聖輝・原 一夫(山形大学)・鈴木 郁美(岩手県立大学)
×
E-006トークナイズ手法が日本語 word similarity タスクに及ぼす影響について
◎山口 聖輝・原 一夫(山形大学)・鈴木 郁美(岩手県立大学)
トークナイザによる文の分割結果が異なると、自然言語処理タスクの精度は異なると考えられる。しかし、近年、トークナイザは、BERTやGPT等の事前学習を前提とする大規模言語モデルと組み合わせて実装されることが多く、トークナイザ単体が自然言語処理タスクに与える影響を調べた研究は少ない。本研究は、MeCabによる単語分割、Byte-Pair Encoding によるサブワード分割、Unigram Language Modelによるサブワード分割という、3つのトークナイザが出力するトークン列をword2vecに与え、得られる単語ベクトルを用いてword similarityタスクの精度比較を行った。その結果、サブワード分割は単語分割よりも優れる結果となった。 |
E-007 |
異なるアーキテクチャを持つ自然言語処理モデルの潜在空間の可視化と比較
◎泉 諒音・神野 健哉(東京都市大学)
×
E-007異なるアーキテクチャを持つ自然言語処理モデルの潜在空間の可視化と比較
◎泉 諒音・神野 健哉(東京都市大学)
本稿では、異なるアーキテクチャを持つ自然言語処理モデルの潜在空間を視覚化し、それらの違いを詳細に比較、検討を行った。具体的には、Sentence-BERTとGPT-2という2つの異なるタイプのモデルにおける潜在変数から色情報を捉える能力を比較した。分析の結果、これらのモデルは潜在空間に類似性が見られるものの、微細な違いも観察された。Sentence-BERTはエンコーダーモデルであり、GPT-2は生成モデルであるため、これらの構造的違いが結果に影響を与えていると考えている。このアプローチは、自然言語処理モデルの固有の特性や強みを明らかにするものであり、モデル選択や進化の貢献を目指している。 |
E-008 |
動画投稿サイトの動画からの特徴抽出によるユーザの意思決定支援に関する研究
◎堂前 拓生・上田 芳弘・坂本 一磨(公立小松大学)
×
E-008動画投稿サイトの動画からの特徴抽出によるユーザの意思決定支援に関する研究
◎堂前 拓生・上田 芳弘・坂本 一磨(公立小松大学)
動画投稿サイトに投稿されている製品レビュー動画には動画投稿者がある製品をどのように評価したかという情報が多く含まれているが,動画の時間が長いものが多く,製品選択の際に複数の動画を見ると多くの時間を消費する傾向がある.そのため,製品レビュー動画から製品の特徴を抽出し,可視化することができれば,製品の購入を検討しているユーザには役立つ可能性が高い.本研究では,製品レビュー動画の会話内容を文字起こしすることでその内容に対して,自然言語処理を用いた分析や音響特徴量を用いた分析を行う.これによりECサイトのレビューのようにユーザが商品選択の支援が可能なシステムの構築を目指す. |
E-009 |
大規模言語モデルを活用したニューラル機械翻訳器の検討
○美野 秀弥・衣川 和尭・河合 吉彦(日本放送協会)
×
E-009大規模言語モデルを活用したニューラル機械翻訳器の検討
○美野 秀弥・衣川 和尭・河合 吉彦(日本放送協会)
近年、大規模言語モデルの出現により要約や対話などの様々な生成タスクが1つのモデルで対応できるようになっている。そこで、本稿では生成タスクの1つである機械翻訳に焦点を当て、大規模言語モデルを活用した機械翻訳器を構築してその翻訳精度を検証した。NHKニュースの日英機械翻訳実験を行い、追加学習データが多い場合は従来手法の機械翻訳器の翻訳精度が高かったのに対し、追加学習データが少ない場合は大規模言語モデルを活用した機械翻訳器の翻訳精度が高いことを確認した。 |
E-010 |
日本語講演文に対する漸進的係り受け解析と文節主辞トークンの入力予測
◎橋本 優希・大野 誠寛(東京電機大学)・松原 茂樹(名古屋大学)
×
E-010日本語講演文に対する漸進的係り受け解析と文節主辞トークンの入力予測
◎橋本 優希・大野 誠寛(東京電機大学)・松原 茂樹(名古屋大学)
同時通訳や字幕生成などの音声言語システムに対して, 音声入力の途中で随時,構文情報を提供することを目的に, 漸進的係り受け解析の開発が進められている. 本稿では,より豊かな情報を後段のシステムに提供するため,漸進的係り受け解析と, 未入力文節の主辞トークンの予測とを同時的に行う手法を提案する. 本手法では,Shift-Reduce法を拡張することにより,文節が入力されるごとに, 未入力文節との構文的関係を明示した係り受け構造を解析するタスクと, 未だ入力されていない係り先文節の主辞トークンを予測するタスクとを同時実行する. 日本語講演文を用いた実験の結果,本手法の有効性を確認した. |
E-011 |
機械翻訳のためのベクトル間類似度に基づく参照訳を用いない自動評価法
◎藤﨑 晴大・越前谷 博(北海学園大学)
×
E-011機械翻訳のためのベクトル間類似度に基づく参照訳を用いない自動評価法
◎藤﨑 晴大・越前谷 博(北海学園大学)
本発表では機械翻訳のための参照訳を必要としない新たな自動評価を提案する。提案手法ではニューラルネットワークモデルより生成されるベクトルと原文の文ベクトルとの間のコサイン類似度を求めた際に、類似度が0から1に正規化された人手スコアと等しくなることを目的としている。WMT22の自動評価タスクデータを用いた性能評価実験の結果、提案モデルから得られるスコアと人手によるDAスコアとの間の相関係数はウクライナ語から英語の訳文においては参加チームの中で最も高く、また、日本語から英語の訳文においても参加チームの中で比較的高く、特定の言語ペアにおいては提案手法の有効性が示された。 |
音声・音楽 |
9月5日(木) 9:30-12:00 4d会場
座長 伊藤 克亘(法政大学) |
E-012 |
ラジオニュースから見る発話行為における「間」の長さ-より良い発話のための「間」の数理モデル化に向けて
◎佐々木 雄也(広島工業大学)
×
E-012ラジオニュースから見る発話行為における「間」の長さ-より良い発話のための「間」の数理モデル化に向けて
◎佐々木 雄也(広島工業大学)
技術の進歩に伴いロボットはかなり人間に近づきつつある.それにもかかわらず「間」の持ったロボットがいないとコメディアンの欽ちゃんは指摘する.ロボットが「間」を持つためには,「間」の数理モデル化が必要不可欠である.そこで本研究では,「間」を発話における無音の時間と仮定し,ラジオニュースを分析することで,「間」の数理モデル化のカギの一つとなる,発話内に入れる「間」を長さを,時間の観点から明らかにすることを目的とする. |
E-013 |
データセット拡張を用いた音声感情認識
◎生形 優也・杉山 颯・田村 仁(日本工業大学)
×
E-013データセット拡張を用いた音声感情認識
◎生形 優也・杉山 颯・田村 仁(日本工業大学)
感情認識は人が円滑なコミュニケーションを行うのに重要なものであり,人と機械との自然なコミュニケーションの実現に必要不可欠なものである.音声感情認識の研究の課題として感情ラベル付きのデータセットに含まれる人数が不足しており,学習を行うと特定個人の声質やその他の特徴量が過学習されて認識精度が低下してしまう問題がある.そこで本研究ではデータセットにボイスチェンジャなどを使用し,データセットの声質やその他の特徴量を変更することでデータセット拡張手法を検討する.これらの手法を用いて感情分類の精度に影響を与えずにデータセットを拡張できるかを実験で検証する. |
E-014 |
声質変換なりすまし攻撃への同一話者判定DNNの頑健性
◎長橋 龍ノ介・亀田 健太郎(千葉大学)・柘植 覚(大同大学)・西田 昌史(静岡大学)・黒岩 眞吾・堀内 靖雄(千葉大学)
×
E-014声質変換なりすまし攻撃への同一話者判定DNNの頑健性
◎長橋 龍ノ介・亀田 健太郎(千葉大学)・柘植 覚(大同大学)・西田 昌史(静岡大学)・黒岩 眞吾・堀内 靖雄(千葉大学)
短い発声での話者照合精度向上を目的に,話者ベクトルを介さずに2つの音声を直接比較 可能な同一話者判定DNNの検討を行なっている.同手法は専門家の音声鑑定技術から発想 を得ており,同一音素系列の局所的な差異を検出できる構造を持っている.この特長から ,全体的には詐称対象話者の音声に似ているものの,局所的には違和感を感じさせる人工 的な詐称音声の検出にも効果が高いと考えた.そこで本稿では,同一話者判定DNNの変換 詐称音声に対する頑健性を,話者照合分野でのデファクト標準となっているx-vectorとの 比較により,その有効性を明らかにした.また,変換元の話者の違いによる詐称成功率に ついての調査も行った. |
E-015 |
One-class ニューラルネットワークを用いた腸蠕動音検出
○藤本 直希・大野 将樹・獅々堀 正幹・岡久 稔也(徳島大学)
×
E-015One-class ニューラルネットワークを用いた腸蠕動音検出
○藤本 直希・大野 将樹・獅々堀 正幹・岡久 稔也(徳島大学)
近年, 腸蠕動音の病態評価を行う方法として, 機械学習を用いることで腸蠕動音を検出し評価する研究が行われている. 関連研究では, 教師なし学習手法であるOne-class SVMを用いた腸蠕動音検出が提案されている. One-class SVMは正例のみを学習させて分類を行う異常検知手法である. しかし, 関連研究で使用されるOne-class SVMは前処理で5つの特徴量を抽出するが, 最適な特徴量が明らかになっていない. 本研究の目的はオートエンコーダを用いて特徴を自動抽出した後, One-classニューラルネットワークを用いて腸蠕動音検出の精度を向上させることである. |
E-016 |
アカペラ歌唱キーを利用した歌唱支援システムの開発
◎大澤 優輝・土肥 紳一(東京電機大学)
×
E-016アカペラ歌唱キーを利用した歌唱支援システムの開発
◎大澤 優輝・土肥 紳一(東京電機大学)
音楽は古くから我々の生活では身近な存在であり,作曲,演奏,視聴,歌唱などその楽しみ方は多様である.ここで歌唱においては,楽しさを感じる要因として心地よく歌唱ができることが挙げられる.しかし,ユーザが歌唱可能な音域と楽曲音域との差異によって歌いにくさを感じることがあり,楽しさが減少してしまうことがある.この問題は楽曲のキーを変更することで解決可能だが,自身に合った楽曲キーを認識していることは少ない.そこで,本研究ではユーザが心地よく歌唱をするための支援を目指し,基本周波数によってアカペラでの楽曲キーを識別,それに合わせた適切な変更楽曲キーを提案するシステムの開発を行う. |
E-017 |
楽曲特徴量に基づく楽曲推薦システムの作成
○山口 翔・堂薗 浩(佐賀大学)
×
E-017楽曲特徴量に基づく楽曲推薦システムの作成
○山口 翔・堂薗 浩(佐賀大学)
近年のサブスクリプションサービスの発達により,ユーザーが様々な楽曲を手に取りやすくなっている.しかし楽曲数が膨大であるため,ユーザーの好みに合う楽曲を探すことに時間を費やしてしまう.この様な問題に対して,「推薦」と「可視化」が有効であると考えた.そこで本研究では,楽曲のサビや盛り上がる部分での特徴量をPythonパッケージのlibrosaを用いて抽出し,その特徴量を基に楽曲の内容を表す画像を生成し,その画像を基に推薦システムを作成する. |
E-018 |
ジャンル特徴量空間の確率密度分布を使用した楽曲推薦システムの提案
◎西原 泰宇・市川 治(滋賀大学)
×
E-018ジャンル特徴量空間の確率密度分布を使用した楽曲推薦システムの提案
◎西原 泰宇・市川 治(滋賀大学)
近年、「嗜好・状況に合った曲」だけでなく「意外性があるが自分が好きな曲」の推薦を求めるニーズが高まっている。そこで、楽曲の特徴を表す直接の特徴量を人間の感性に則した特徴量にマップしてから楽曲の類似性を計算する手法を提案する。提案手法では、多数のユーザーによって作成されたプレイリスト情報を用いて複数のジャンルごとの曲集合を作成し、このジャンルへの帰属の程度を新たな特徴量空間として使用する。プレイリスト情報は一種の集合知として機能することから、人間の感性を反映した特徴量となっていることが期待される。この特徴量を用いて楽曲推薦を行うことで、直接的な類似性を超えた推薦を行うことを研究の目標とする。 |
言語理解とコミュニケーション(NLC) |
9月5日(木) 9:30-12:00 4e会場
座長 石野 亜耶(広島経済大学) |
E-019 |
BERTを利用したSNSユーザの居住地推定
◎平松 洪輝・安藤 一秋(香川大学)
×
E-019BERTを利用したSNSユーザの居住地推定
◎平松 洪輝・安藤 一秋(香川大学)
本研究では,SNSに日本語で発信された病気・症状を含む投稿を収集・分析することで,感染症の流行状況や各種症状の発症状況を地域別や時系列別に可視化するシステムの構築を目的とする.本システムを利用することで,未知の感染症を含めた,様々な病気・症状の動向を捉えることが可能になる.提案システムを実現するためには,投稿者の居住地を推定する技術が必要である.我々の先行研究では,英語圏のユーザを対象とした居住地推定において高い性能を達成したモデルを参考に,独自の居住地推定モデルを提案した.本稿では,先行モデルの推定性能の改善を目的として,BERTを利用した居住地推定モデルを提案し,その性能を評価する. |
E-020 |
日本文化の感情表出における表情の特徴抽出に関する検討
◎平野 善識・奥村 健太(名古屋国際工科専門職大学)
×
E-020日本文化の感情表出における表情の特徴抽出に関する検討
◎平野 善識・奥村 健太(名古屋国際工科専門職大学)
意思疎通において非言語情報が果たす役割は本来大きいが、オンライン会議の機会が増えた昨今ではその取得が困難なため様々な問題が生じている。表情や音声信号といった非言語的情報を複合し「場の雰囲気」を工学的に捕捉できれば、意思疎通の客観視に役立つと考えられる。そのために主に観測すべきなのは人間の感情表出であるが、文化依存の差異が大きい一方、既存のデータセットは欧米諸国を基準としたものが多く、日本国内での実用性は低い。そこで本稿では研究の諸段階として、日本の感情表出にも対応できる特徴量を、まず表情関連に着目して調査する。その結果を通じて、今後の手法提案ならびにプロセスの効率化を検討する。 |
E-021 |
カードゲームを用いた日本人と外国人の友好関係構築
◎渡邊 隆介・島川 博光(立命館大学)
×
E-021カードゲームを用いた日本人と外国人の友好関係構築
◎渡邊 隆介・島川 博光(立命館大学)
留学生が増えており、仲間に馴染めない所をよく見かける。話す言語が異なる人同士がカードゲームで盛り上がっている事例を調べることで、彼らが馴染めない原因が判明すると考えられる。盛り上がっている時は声が大きくなる。その場合での、言葉、または、振る舞いは、それぞれの国で異なるはずである。本研究では、日本人同士、外国人同士、日本人と外国人とでカードゲームを行い、映像、音声、文字などを取り出し、日本人と外国人の共通の特徴と異なる特徴を抽出する。これらによって、日本人と外国人が仲良くなるための方法を明確化し、彼らが親しくなるきっかけを作る。 |
E-022 |
うつ病の早期検知に向けたブログデータの時系列分析
◎中野 遼河・安藤 一秋(香川大学)
×
E-022うつ病の早期検知に向けたブログデータの時系列分析
◎中野 遼河・安藤 一秋(香川大学)
本研究では,ブログ記事の内容からブログ著者のうつ病の兆候を早期に検出する技術の実現を目的としている.本稿では,その前段階として,うつ病であることを明示した著者のブログ記事を時系列分析することで早期検出手法の検討に繋ぐ.特に,うつ病診断前のブログ記事には,早期検知に有効な素性がより埋もれていると仮定し,うつ病と診断される前と診断された後の記事内容の特徴や関連性などを確認する.具体的には,各記事間の類似度,ネガティブ・ポジティブ度の変化などを時系列で分析する.また,うつ病患者は,気分の浮き沈みが激しいことがあるため,それぞれの特徴量の分散についても確認する. |
E-023 |
(講演取消) |
⾃然⾔語処理(NL) 3 |
9月5日(木) 15:30-17:30 5e会場
座長 関 喜史(フェアリーデバイセズ株式会社) |
E-024 |
SNS世論分析のための一般ドメインSNSデータセットの構築
◎石渡 太智(日本放送協会/東京工業大学)・宮﨑 太郎・後藤 淳(日本放送協会)
×
E-024SNS世論分析のための一般ドメインSNSデータセットの構築
◎石渡 太智(日本放送協会/東京工業大学)・宮﨑 太郎・後藤 淳(日本放送協会)
放送局では,従来の世論調査で把握できない潜在的な一般世論の動向を明らかにするために,SNSを用いた言論分析を行なっている.SNS世論分析を実現するには,分析対象の投稿が示す感情ラベルを取得する必要があるが,投稿の規模が大きいため,少量の投稿にラベルを与え学習した識別器を用いて半自動で取得している.しかし,識別器は分析対象に過適合するため,他の分析対象に対する汎化性能が低下する課題が存在する.本研究は,分析対象を限定しない一般ドメインSNSデータセットを構築し,そのデータで学習した識別器を提案する.実験を通して提案手法の有効性を確認し、将来的なアノテーションコストを削減できる可能性を示唆した. |
E-025 |
大規模言語モデルを用いた将棋の解説文生成のためのデータセットの構築
○楠 純哉・吉見 毅彦(龍谷大学)
×
E-025大規模言語モデルを用いた将棋の解説文生成のためのデータセットの構築
○楠 純哉・吉見 毅彦(龍谷大学)
近年、将棋の対局を観戦する人が増えているが、一般の人が内容を理解することは難しい。そこで、対局から 解説文生成することによって、一般の人が理解できるようにすることを目的とする。大規模言語モデルを用いて、将棋の解説文の生成を行った。大規模言語モデルのファインチューニングを行なった。ファインチューニングには専門家が作成した解説文から、対局の内容とは関係ない情報(消費時間や対局地など)を取り除き、対局者を先手か後手のどちらかに置き換えたデータを使用した。人手で期名人戦第一局、111手分の将棋解説文を5段階評価で評価した。 そして、解説文として完全に正しくないと評価された数がファインチューニングの前後で23個から0個になった。 |
E-026 |
強化学習を用いた駄洒落の自動生成
○塚見 大吾郎(千葉大学)・全 へい東(千葉大学)
×
E-026強化学習を用いた駄洒落の自動生成
○塚見 大吾郎(千葉大学)・全 へい東(千葉大学)
日本語に対応した大規模言語モデル(GPT-2)を利用し駄洒落の自動生成を試みた。この研究では「種」とよぶ単語と同じ音韻の異義語を含む文を駄洒落と定義する。言語モデルには「種」を与えて駄洒落を生成させる。まず「北大駄洒落コーパス」で追加学習を行い(Ref. LMとよぶ)、次に強化学習を用いたRLHFによって駄洒落文を生成するactive LMを学習する。最適化にはPPOアルゴリズムを用いた。500個の「種」で推論を行った結果Ref. LMの1%に対しactive LMは約10%の駄洒落を生成した。強化学習の報酬設計を見直すことによりさらに生成率を向上させる事を目指している。また数字列を覚えやすくする短文(語呂合わせ)など、他のタスクへの応用も検討している。 |
E-027 |
LLMを用いた画像に対する面白キャプション生成
◎根來 勇太・森田 和宏・泓田 正雄(徳島大学)
×
E-027LLMを用いた画像に対する面白キャプション生成
◎根來 勇太・森田 和宏・泓田 正雄(徳島大学)
電笑戦など,これまで数多くの,「AIに人を笑わせることができるのか」という取り組み・研究が行われてきた.美濃口らの先行研究ではboketeのデータから,CNNとLSTMを連結した深層学習モデルを用いて画像に対するボケた文章の生成を行った.この研究では,STAIR Captionsをデータセットとした場合よりは,面白いボケを生成できているが,人間のボケより面白くない,出力された文章が破綻していることがあるなどの改善するべき問題点がいくつか存在する.また,ChatGPTをはじめとしたLLMは質疑応答などのタスクは得意だが,ジョークや謎かけを生み出すことは苦手である.そこで本稿では,LLMをboketeのデータでファインチューニングすることで先行研究の問題点の改善とLLMによる面白い文章生成の実現を目指す. |
E-028 |
返信コメント予測を用いたSNS投稿メッセージの炎上可能性判定手法
◎七條 旭澄人・佐川 雄二・田中 敏光(名城大学)
×
E-028返信コメント予測を用いたSNS投稿メッセージの炎上可能性判定手法
◎七條 旭澄人・佐川 雄二・田中 敏光(名城大学)
近年、ソーシャルネットワークサービス(SNS)の普及により情報の拡散速度は飛躍的に向上している。それによりユーザ間のコミュニケーションは益々活発になることが予想される。しかし、SNSは便利である一方で適切に利用しなければ炎上を招く恐れがある。本研究では、入力テキストから返信コメントを予測生成し、それらを用いて入力テキストの炎上可能性を判定する手法について提案する。具体的には、生成した返信コメントを極性値判定と類似度判定を用いることによって炎上可能性を判定する。実際の投稿文を用いてシステムを実行した結果、提案手法の有用性が確認できた。 |
⾃然⾔語処理(NL) 4 |
9月5日(木) 15:30-17:30 5f会場
座長 榊 剛史(東京大学) |
E-029 |
音声誤認識された日本国内住所の事後訂正
○米持 幸寿(Pandrbox)
×
E-029音声誤認識された日本国内住所の事後訂正
○米持 幸寿(Pandrbox)
音声認識で日本国内の住所を入力する,というニーズがある.残念ながら一般用語を学習した機械学習音声認識では誤った文字列が出力されることがしばしば起こる. 今日の音声認識は機械学習を用いたものがほとんどであり,正しい結果を得るには認識モデルを正しく訓練することが効果的である.しかし,実際のシステム開発における現場では音声認識モデルを再訓練するには知識,コストなどの面で多くの障壁がある.その障壁を避けるために、現存する音声認識サービスが出力した結果が「間違っている」ことを識別し,それを適宜訂正することも重要である. 本研究では,音声認識により誤認識された日本国内の住所文字列を,音声認識の処理後に訂正して正しい結果を得る方法を提案し,その性能を測定する. |
E-030 |
未登録語データベースを活用した雑談型対話システム
◎仲村 敦・土屋 誠司・渡部 広一(同志社大学)
×
E-030未登録語データベースを活用した雑談型対話システム
◎仲村 敦・土屋 誠司・渡部 広一(同志社大学)
近年,福祉の場などでロボットが人間のパートナーとして活躍することが期待されており,そのためにロボットと人間の円滑な意思疎通が求められている.円滑な意思疎通ためには,ロボットも人間と同様に自然言語を用いた対話を行う必要があるので,雑談型の対話に関する研究は人間のパートナーとして活躍するロボットの実現に貢献できると考えられる. 既存の対話システムでは,システムのデータベースに存在しない語を登録する未登録語データベースを以後の対話に上手く活用できないことが問題となっていた.本研究では,未登録語データベースに語と語の関係を登録することで,この問題を解決する. |
E-031 |
エッセイデータにおけるCNNベースモデルによる議論要素抽出
◎白藤 大幹・岡 隆之介・田口 進也(三菱電機)
×
E-031エッセイデータにおけるCNNベースモデルによる議論要素抽出
◎白藤 大幹・岡 隆之介・田口 進也(三菱電機)
本研究では,テキスト内の主張や前提等の議論要素をエッセイデータから抽出する技術について検討する.固有表現データで学習した言語モデルmLUKEに語彙近傍情報を考慮するためのCNNを挿入した手法の有効性を評価する.接続詞等の談話関係を表す語句が議論要素の近傍にある可能性があるため,CNNによってこれらの周辺語句に基づく要素推定精度が高まると予想される.エッセイデータを段落単位に分割したデータから主張と前提の議論要素を抽出するタスクで提案手法を評価した結果,CNNの挿入により挿入しない場合よりも4.13%の抽出精度向上が確認された.今後は,各要素の関係予測に取り組む予定である. |
E-032 |
会話履歴を考慮する応答手法におけるBERTの活用
◎石川 大貴・土屋 誠司・渡部 広一(同志社大学)
×
E-032会話履歴を考慮する応答手法におけるBERTの活用
◎石川 大貴・土屋 誠司・渡部 広一(同志社大学)
近年,AIの進歩によりロボットとの雑談型対話が注目されており,人間のパートナーとして活躍するロボットの実現に向けて重要な研究分野として,教育や娯楽,心理的支援など様々な分野で活躍することが期待されている. ロボット対話システムを構築するうえで,同じ内容を何度も繰り返しユーザに尋ねてしまい,ユーザが求めるような自然な会話応答は生成されにくいという問題がある. そこで,本研究では,BERTによる文章の分散表現を活用し,文章をベクトル化し,コサイン類似度を用いて文章同士の類似度を測ることで,ユーザの過去の会話内容を考慮した応答を生成できるようにした. |
E-033 |
台詞間の関係と登場人物の性別を用いた小説台詞の発話者特定方法の検討
◎岩本 和真・安藤 一秋(香川大学)
×
E-033台詞間の関係と登場人物の性別を用いた小説台詞の発話者特定方法の検討
◎岩本 和真・安藤 一秋(香川大学)
小説内に存在する鍵括弧で囲まれている文章は,登場人物の発話を表現していることが多く,これらの発話対(台詞対)を登場人物間の会話とみなすことができる.本研究では,小説の台詞対を抽出することで,日常会話コーパスを自動構築することを目的とする.一般的な小説には複数の人物が登場するため,二者間の会話で構成される会話コーパスを構築するためには,台詞の発話者を特定する必要がある.発話者を特定する情報は,台詞周辺に存在する場合だけでなく,台詞と離れた場所に存在する場合もある.そこで,本稿では,台詞間の関係や登場人物の性別といった複数の手がかりによって発話者を特定する手法について検討する. |
E-034 |
報酬表現に着目した強化学習による傾聴対話モデルの改善
◎松本 奈々・安藤 一秋(香川大学)
×
E-034報酬表現に着目した強化学習による傾聴対話モデルの改善
◎松本 奈々・安藤 一秋(香川大学)
近年,日本の総人口に占める高齢者人口の割合は過去最高となり,日本における高齢化が進むと同時に要介護者数も増加している.介護現場において,高齢者の発言を傾聴することは信頼関係を築くために重要であり,一つの実現手段として「バリデーション」がある.しかし,介護士の人材不足等の問題から個人に十分な時間をかけてケアすることが困難である.本研究では介護環境の改善を目指して,バリデーションを活用した対話システムの構築を目的とする.著者らの先行研究では,強化学習を用いた傾聴対話モデルについて提案した.本稿では,先行研究で提案したモデルにおいて報酬を与える表現を改善し,共感性や尊重性の観点から効果を検証する. |
音楽 |
9月6日(金) 9:30-12:00 6d会場
座長 酒向 慎司(名古屋工業大学) |
E-035 |
音楽解析用回路ニューラルネットワークの活性パルス強度分布とメロディ人気度との関連
◎水村 駿太・田村 大河・竹内 幹(明星大学)
×
E-035音楽解析用回路ニューラルネットワークの活性パルス強度分布とメロディ人気度との関連
◎水村 駿太・田村 大河・竹内 幹(明星大学)
生体系のアナログ的側面を反映させた電気回路ニューラルネットワークを構築し、LTspiceシミュレーションにより、人気のあるメロディの特徴を分析した。曲のmidiデータのメロディのみをPythonコードでLTspiceの入力電圧波形に変換する。3連音活性パルス強度の曲ごとの頻度分布を解析した結果、ビートルズ約200曲のうち、上位20曲では、強度が小さい3連音活性パルスの発生頻度が滑らかに上昇する傾向が見られた。すなわち、活性パルス強度と頻度の対数の相関係数が、−0.7 ~ −0.8の間に偏在する。ヒット曲はメロディ、歌詞、ビート、アレンジなど多くの要素が関与するものの、今回得られた結果は、人気の高いメロディの特徴の一つであると考える。 |
E-036 |
MIDIデータの遠隔送受信に関するソフトウェア開発と検証
◎榊原 圭吾・皆月 昭則(釧路公立大学)
×
E-036MIDIデータの遠隔送受信に関するソフトウェア開発と検証
◎榊原 圭吾・皆月 昭則(釧路公立大学)
近年、世界的に新型コロナウイルスが蔓延し外出自粛を強いられた社会では、Web会議システムを用いた会議や授業が急速に拡大した。その一方で、Web会議システムを用いた音質は圧縮などの処理要因により音楽用途へは不向きであり、音楽業界での採用例は多くない。そこで本研究では音声の代わりに電子楽器の通信規格であるMIDIを用いて通信することで、実質的に高い音質で送受信することを可能にして、かつ受信したデータを作曲などへ応用することが可能である。結果、リアルタイムにMIDIデータを送受信することができるソフトウェアを開発し、遅延速度を測定してその有効性を検証した。 |
E-037 |
楽器経験の差と熟達度が初見楽譜に対する記憶・再生に及ぼす影響
◎佐藤 拓也・中平 勝子(長岡技術科学大学)
×
E-037楽器経験の差と熟達度が初見楽譜に対する記憶・再生に及ぼす影響
◎佐藤 拓也・中平 勝子(長岡技術科学大学)
技能教育における課題の一つに,技能習熟過程の個人差がある.その原因として,個人の過去の経験が異なることが挙げられる.本稿は,個人の経験を考慮した適応型学習に対する基礎研究として,個人の経験を調査しやすい器楽演奏に着目する.その中でも,1980年代以降普及が進んでいる鍵盤楽器を対象に,楽器経験と学習環境の差が,新規学習課題に対する記憶・再生の質に与える影響を実験により調査する.新規学習課題は,初見楽譜に対する読譜・演奏とし,実際の学習環境を模した記憶条件下で,楽曲の擬似的な記憶・再生を行わせる.その際の演奏精度・所要時間・視線計測によって、楽器経験と学習環境の影響を考察する. |
E-038 |
エレクトリックベース中級者の支援に向けた演奏特徴の抽出と評価
◎山脇 稜平・奥村 健太(名古屋国際工科専門職大学)
×
E-038エレクトリックベース中級者の支援に向けた演奏特徴の抽出と評価
◎山脇 稜平・奥村 健太(名古屋国際工科専門職大学)
基本的な演奏フォームを習得した中級者が、理想とする演奏との差異を把握するには、第三者からのフィードバックを受けることが重要である。しかし、演奏人口が少ないエレクトリックベースではそのようなフィードバックを得られる機会がほかの楽器に比べて限られるため、効率的な技術向上が困難になりやすい。 本研究では中級者の支援に着目して、演奏指示に対する実演奏との間の微細な差異を抽出し、表現に含まれる特定の傾向やばらつきを定量的に評価可能な枠組みを提案する。練習体験を損なわないシンプルな設備で動作するプロトタイプを実装し、演奏者に客観的なフィードバックを返すための有用性を評価する。 |
E-039 |
リズムゲームを用いた作曲支援
◎中田 恭維・梅村 祥之(広島工業大学)
×
E-039リズムゲームを用いた作曲支援
◎中田 恭維・梅村 祥之(広島工業大学)
中学の音楽の教科書のトピックの一つである「リズムゲーム」をもとにした作曲支援プログラムを考案した. 授業内での音楽の創作活動は,スキルや知識,時間が求められるため,後回しにされがちである. そのため,それらの問題点を解決させ,音楽教育の創作分野で利用されることを目指した. プログラム内で,和音や協和,進行などの基本をレクチャーすることで,曲の作りやすさやクオリティを確保した. また,学校教育では,近年タブレットPC等で授業できるようになったため,それをうまく活用できる形で開発を進めた. |
E-040 |
Julia集合アニメーションに基づく音楽生成への試み
◎白石 慶太・梅村 祥之(広島工業大学)
×
E-040Julia集合アニメーションに基づく音楽生成への試み
◎白石 慶太・梅村 祥之(広島工業大学)
フラクタル図形の一つであるJulia集合のアニメーションから、音楽を生成しました。Julia集合は数値を変えることで形を変えます。それを連続的な数値の変化でアニメーションとし、描画した図形の面積に対応した音高を出力する音楽生成としました。 |
E-041 |
かな書道画像からの音楽生成の試み
○梅村 祥之(広島工業大学)
×
E-041かな書道画像からの音楽生成の試み
○梅村 祥之(広島工業大学)
平安時代の仮名を数字分続け字とする書道作品は,流れるような筆使いから リズム感を感じることができる.そこで,書道作品画像から筆跡時系列を 推定した.一続きの続け字ごとのに筆跡の中心座標を求め,筆位置が中心から 遠いほど低い音高,近いほど高い音高に対応させ,さらに, 都節音階などの和風音階にマッピングして音符系列を生成した. あらからじめ設定した和音進行に基づく伴奏を付加し,伴奏と主旋律を 協和させる音高調整を行い,書の雰囲気を持つ楽曲を生成した. |
⾃然⾔語処理(NL) 5 |
9月6日(金) 13:10-15:40 7f会場
座長 牧田 光晴(LINEヤフー株式会社) |
E-042 |
BERTの分散表現を用いた類似度に基づくデータセット拡張の検討
◎春日 優虎・浦野 昌一(明治大学)
×
E-042BERTの分散表現を用いた類似度に基づくデータセット拡張の検討
◎春日 優虎・浦野 昌一(明治大学)
記述式問題の自動採点モデルなど, 大規模言語モデルを用いた高精度な分類モデルが多く開発されている. しかしながら, 大規模言語モデルのファインチューニングには多くのデータセットを必要とする一方で, 秘匿性の高いタスクにおいては十分な量のデータセットを集められないという課題がある. また, データセット拡張手法のひとつであるBack Translation(逆翻訳)は用いる言語により類似性が大きく変わり, これを正確に判別する手段が必要となる. そこで本研究では, BERTの分散表現から作られたベクトルの類似度を調べ, 拡張前後のデータセットの類似度を定量的に測ることで質の良いデータセット拡張を行うことを目指す. |
E-043 |
まぎらわしい分類タスクにおける言語モデルのファインチューニングとその解釈
○中田 駿平・正田 備也(立教大学)
×
E-043まぎらわしい分類タスクにおける言語モデルのファインチューニングとその解釈
○中田 駿平・正田 備也(立教大学)
本研究では近接分野の学術論文の自動分類を試みる.データは数学の一領域である微分幾何学に関する5分野のものを使用する.これらの分野はたがいに近接しており出現単語が類似している.そのためBag of Wordsのような古典的手法による分類には限界がある.本研究では言語モデルをファインチューニングすることで高性能な分類器を構築する.またファインチューニングによりモデルのふるまいがどのように変化したかについて積分勾配法による解釈を試みる. |
E-044 |
Evaluating Fine-Tuned Modern LLMs Beyond BERT for Medical Text Classification
○Hara Ryan・Masada Tomonari(Rikkyo University)
×
E-044Evaluating Fine-Tuned Modern LLMs Beyond BERT for Medical Text Classification
○Hara Ryan・Masada Tomonari(Rikkyo University)
In recent years, scholars have diligently worked to enhance the effectiveness of medical text classification, which is characterized by an abundance of scientific terminology, abbreviations, and acronyms. This complexity presents challenges for models in understanding contextual nuances and accurately categorizing text content. The introduction of BERT has resulted in significant advancements in classification task performance compared to traditional approaches. This study aims to evaluate whether more recent Large Language Models (LLMs) can further enhance efficacy in this domain. Specifically, it seeks to investigate the impact of parameter size and the benefits of models pre-trained on medical text. |
E-045 |
日本語LLMのPrompt Tuningによる著者識別
◎櫻井 航・浅野 雅人・井元 大輔・本間 正勝・黒沢 健至(科学警察研究所)
×
E-045日本語LLMのPrompt Tuningによる著者識別
◎櫻井 航・浅野 雅人・井元 大輔・本間 正勝・黒沢 健至(科学警察研究所)
近年の大規模言語モデルの多くは適切なプロンプトを与えることで、モデルのパラメータを更新せず下流のタスクに対応できる。Prompt Tuningは、プロンプトを学習で設計するものであり、なかでもその埋め込みベクトルを直接設計するものはドメインシフト性能が高く実応用に適した手法といえる。一方、候補者の中から文章を書いた人間を識別する著者識別については、特に日本語に関してこのような大規模言語モデルの適用に関する検討が十分に進んでいるとはいえない。本研究では日本語で事前学習された大規模言語モデルに、埋め込みベクトルを学習するPrompt Tuningを行って著者識別性能を確認するとともに、そのドメインシフト性能の検証を行った。 |
E-046 |
BERTを用いた攻撃的表現の検出
◎三浦 彩茄・井上 浩孝(呉工業高等専門学校)
×
E-046BERTを用いた攻撃的表現の検出
◎三浦 彩茄・井上 浩孝(呉工業高等専門学校)
SNSは容易に遠く離れた人たちとのコミュニケーションや情報共有ができるため、非常に便利なサービスである。しかしSNSの普及に伴い、誹謗中傷が増えているのも事実である。本研究ではBERTを用いて、攻撃的な表現を含む文章を判定した。学習用データとしてデータはSNSのXから攻撃的な文章とそうでない文章を収集した。 収集した文章には、攻撃的か否かを示すアノテーションを行い、これを用いてデータセットを作成した。このデータセットの80%を訓練用に、20%をテスト用に分け、このモデルを評価したところかなり良好な精度の識別が可能であった。今後、より多くの投稿を収集し、より正確なモデルを作成したい。 |