第158回音声言語情報処理研究発表会

プログラム詳細は以下をご参照ください。
https://www.ipsj.or.jp/kenkyukai/event/nl266slp158.html

■低頻度・低資源語音声認識
（1）階層的Deep Biasingを用いた低頻度語に頑健な音声認識
　　　楠奈穂美，樋口陽祐，小川哲司，小林哲則

（2） Generative Error Correction for Product Names with Phonemic and Lexical Constraints
　　　サントソジェニファー，石塚賢吉，大野正樹

（3）『日本語諸方言コーパス』に対する音素転記を活用した方言識別と標準語転記
　　　本多智揮，河原達也

（4）言語非依存の調音特徴検出を併用した低資源言語の音声認識
　　　馬越亮，坂井信輔，李在詠，河原達也

■招待講演
（5）言語モデルのマルチモーダル言語理解能力
　　　渡辺太郎

■音声分析
（6） Acoustic features of recorded and produced words from Praat
　　　Eri Kondo，Kamran Mohammad，Mohsin Ali，Takehito Hayami

（7）オートエンコーダによるポケモン日本語名音声の特徴量抽出とクラスタリング解析
　　　田畑千織

■LLM応用
（8）公教育のための外国語の文章題に対するブラウザ上での難易度別読解支援と求解の複数指示追従
　　　江原遥

（9）意味的構成性を考慮した言語モデルの語彙削減
　　　田村鴻希，吉永直樹

（10）BERTモデルによるクラスタリング精度の比較と自動採点モデルの改良に関する提案
　　　春日優虎，浦野昌一

（11）日本語におけるプロンプト推定時および再出力時のデコーディング戦略が与える影響とその考察
　　　北村侑聖，アフマドアクマルアミヌディン，藤沢匡哉

■データベース（音声・マルチモーダル）
（12）音声収録および提示環境の評価・設定支援ツールの再設計における巨大FFTの応用
　　　河原英紀，榊原健一，水町光徳，北村達也，矢田部浩平

（13）エージェントの発話とジェスチャによる調理動画支援システムの構築
　　　肥田京佳，徳久良子

（14）イベントカメラを用いたマルチモーダル対話コーパスの構築に向けて
　　　行旨王我，水谷航太，延原章平，河野誠也

■データベース（言語）
（15）日本語文書要約タスクにおけるHallucination検出手法の評価用データセットの構築
　　　田中日加吏，欅惇志，小町守

（16）Japanese SimpleQA: 日本語における事実に基づいた回答能力の評価ベンチマーク
　　　三上裕明，鈴木脩司

■招待講演
（17）音声コーパスの過去・現在・未来
　　　板橋秀一，大須賀智子

■分野横断
（18）自己教師あり学習による音声表現とNeural Audio Codec特徴量の融合による歌声自然性MOS予測
　　　有田諒子，朴浚鎔，中田亘，齋藤佑樹，猿渡洋

（19）外国語訛りに頑健なASRの実現に向けた微分可能k-meansを用いたL1とL2のマルチタスク学習によるinterlanguage speech intelligibility benefitの高度な再現
　　　恩田健太郎，深山覚，齋藤大輔，峯松信明

（20）音響データの差分説明を利用した汎用型異常検知モデルの提案
　　　国定恭史，前橋祐斗，藤枝大

■国際会議参加報告
（21）国際会議Interspeech2025参加報告
　　　二見颯，藤田健一

（22）国際会議ACL2025参加報告
　　　永田亮

■音声合成
（23）日本語ラップスタイル合成歌唱を対象としたスウィングの統計分析
　　　山本泰我，森勢将雅

（24）N-gramによる歌声合成に向けた芸術言語構築法の検討
　　　石川真大，森勢将雅

■情報抽出
（25）法令文における法令間委任関係の自動抽出
　　　藤田剛，澤田悠冶，坂井優介，渡辺太郎

（26）プロンプト最適化を用いた検索クエリと検索目標の関係性アノテーション
　　　中西亮輔，鈴木結友，鷲見優一郎，光田英司，二宮由樹，曽根悠太郎，三輪和久

（27）発話テキストに基づく話者推定手法の開発
　　　渡部賢治，松井くにお

■Vision Language
（28）疑似正例を用いた類似度標準化によるModality Gapの低減
　　　山下修平，白藤大幹，斉藤辰彦

（29）日本語の1枚謎に対するVision Language Modelの謎解き力検証
　　　宮本悠花，松吉俊

（30）スライド作成技術向上を目的とした文章に基づく構造解析手法の研究
　　　磯邉健太，大倉裕貴，河崎隆文，岩本健嗣

■音声認識一般
（31）モダリティ別スパースMoEを組み込んだDecoder-only Conformerによる音声認識
　　　Lee Jaeyoung，三村正人

（32）離散トークンを入力とする音声認識のためのフロントエンド音声強調
　　　芦原孝典，堀口翔太，松浦孝平，落合翼，デルクロアマーク

一括ダウンロード

音声言語情報処理（SLP）へ戻る

このページの先頭へ