第158回音声言語情報処理研究発表会

プログラム詳細は以下をご参照ください。
https://www.ipsj.or.jp/kenkyukai/event/nl266slp158.html

■低頻度・低資源語音声認識
(1) 階層的Deep Biasingを用いた低頻度語に頑健な音声認識
   楠 奈穂美,樋口 陽祐,小川 哲司,小林 哲則

(2) Generative Error Correction for Product Names with Phonemic and Lexical Constraints
   サントソ ジェニファー,石塚 賢吉,大野 正樹

(3) 『日本語諸方言コーパス』に対する音素転記を活用した方言識別と標準語転記
   本多 智揮,河原 達也

(4) 言語非依存の調音特徴検出を併用した低資源言語の音声認識
   馬越 亮,坂井 信輔,李 在詠,河原 達也

■招待講演
(5) 言語モデルのマルチモーダル言語理解能力
   渡辺 太郎

■音声分析
(6) Acoustic features of recorded and produced words from Praat
   Eri Kondo,Kamran Mohammad,Mohsin Ali,Takehito Hayami

(7) オートエンコーダによるポケモン日本語名音声の特徴量抽出とクラスタリング解析
   田畑 千織

■LLM応用
(8) 公教育のための外国語の文章題に対するブラウザ上での難易度別読解支援と求解の複数指示追従
   江原 遥

(9) 意味的構成性を考慮した言語モデルの語彙削減
   田村 鴻希,吉永 直樹

(10)BERTモデルによるクラスタリング精度の比較と自動採点モデルの改良に関する提案
   春日 優虎,浦野 昌一

(11)日本語におけるプロンプト推定時および再出力時のデコーディング戦略が与える影響とその考察
   北村 侑聖,アフマド アクマル アミヌディン,藤沢 匡哉

■データベース(音声・マルチモーダル)
(12)音声収録および提示環境の評価・設定支援ツールの再設計における巨大FFTの応用
   河原 英紀,榊原 健一,水町 光徳,北村 達也,矢田部 浩平

(13)エージェントの発話とジェスチャによる調理動画支援システムの構築
   肥田 京佳,徳久 良子

(14)イベントカメラを用いたマルチモーダル対話コーパスの構築に向けて
   行旨 王我,水谷 航太,延原 章平,河野 誠也

■データベース(言語)
(15)日本語文書要約タスクにおけるHallucination検出手法の評価用データセットの構築
   田中 日加吏,欅 惇志,小町 守

(16)Japanese SimpleQA: 日本語における事実に基づいた回答能力の評価ベンチマーク
   三上 裕明,鈴木 脩司

■招待講演
(17)音声コーパスの過去・現在・未来
   板橋 秀一,大須賀 智子

■分野横断
(18)自己教師あり学習による音声表現とNeural Audio Codec特徴量の融合による歌声自然性MOS予測
   有田 諒子,朴 浚鎔,中田 亘,齋藤 佑樹,猿渡 洋

(19)外国語訛りに頑健なASRの実現に向けた微分可能k-meansを用いたL1とL2のマルチタスク学習によるinterlanguage speech intelligibility benefitの高度な再現
   恩田 健太郎,深山 覚,齋藤 大輔,峯松 信明

(20)音響データの差分説明を利用した汎用型異常検知モデルの提案
   国定 恭史,前橋 祐斗,藤枝 大

■国際会議参加報告
(21)国際会議Interspeech2025参加報告
   二見 颯,藤田 健一

(22)国際会議ACL2025参加報告
   永田 亮

■音声合成
(23)日本語ラップスタイル合成歌唱を対象としたスウィングの統計分析
   山本 泰我,森勢 将雅

(24)N-gramによる歌声合成に向けた芸術言語構築法の検討
   石川 真大,森勢 将雅

■情報抽出
(25)法令文における法令間委任関係の自動抽出
   藤田 剛,澤田 悠冶,坂井 優介,渡辺 太郎

(26)プロンプト最適化を用いた検索クエリと検索目標の関係性アノテーション
   中西 亮輔,鈴木 結友,鷲見 優一郎,光田 英司,二宮 由樹,曽根 悠太郎,三輪 和久

(27)発話テキストに基づく話者推定手法の開発
   渡部 賢治,松井 くにお

■Vision Language
(28)疑似正例を用いた類似度標準化によるModality Gapの低減
   山下 修平,白藤 大幹,斉藤 辰彦

(29)日本語の1枚謎に対するVision Language Modelの謎解き力検証
   宮本 悠花,松吉 俊

(30)スライド作成技術向上を目的とした文章に基づく構造解析手法の研究
   磯邉 健太,大倉 裕貴,河崎 隆文,岩本 健嗣

■音声認識一般
(31)モダリティ別スパースMoEを組み込んだDecoder-only Conformerによる音声認識
   Lee Jaeyoung,三村 正人

(32)離散トークンを入力とする音声認識のためのフロントエンド音声強調
   芦原 孝典,堀口 翔太,松浦 孝平,落合 翼,デルクロア マーク

一括ダウンロード