第160回音声言語情報処理研究発表会

プログラム詳細は以下をご参照ください。
https://www.ipsj.or.jp/kenkyukai/event/slp160.html

■MUS
(1) 「音学シンポジウム2026」開催にあたって
   中村 栄太,吉井 和佳,柏木 陽佑,中鹿 亘,上江洲 安史,井本 桂右

(2) 音楽データサイエンスにおける演奏科学研究の取り組み
   三浦 雅展,竹下 和秀

(3) シングルチャネルマルチトーカー音声認識の進展
   増村 亮

(4) K-POPにおける歌詞構造と音楽的区切りの不一致が生み出す表現効果の分析
   鈴木 源吾,安達 萌衣

(5) 楽曲の文脈情報理解に向けたマルチモーダル大規模言語モデルによる楽曲同定能力の検討
   竹本 健悟,蓮実 拓也,Welly Naptali,和気 雅弥,橘 健太郎

(6) Tonal Pitch Spaceによる和音間距離の音楽的解釈-第2報-
   山口 直彦,北原 鉄朗

(7) 歌詞を時間軸アンカーとするヴァイオリン演奏支援記譜インタフェース「さくら譜」の設計と実装~既知の楽曲における五線譜の読譜プロセスの代替・補完~
   小林 さくら

(8) モジュール分離型アーキテクチャによるオーディオエフェクト設定逆推定
   デ ポンテス ジェフェルソン マコト,ホワン ウェンチン,戸田 智基

(9) サッカーの試合における試合状況を考慮した群衆歓声音の生成手法の検討
   長谷川 和希,小玉 周平

■SLP
(10)環境音イベント検出におけるVariational Autoencoderを用いた入力音の適合度判定に関する検討
   高見 陽斗,原 直

(11)キャラクター画像を用いた日本語テキスト音声合成の声質制御
   周 廷叡,柳井 啓司

(12)口唇映像を用いたマルチモーダル音声認識における構音障害者のための話者適応の検討
   木山 大輔,原 直

(13)自然文で声質制御可能なTTSにおける音声トークン列予測のLMの違いによる比較
   伊佐早 佳月,髙木 一幸

(14)混合正規分布条件付け拡散確率モデルベース声質変換
   岸田 拓也,中鹿 亘

(15)Whisperを基盤とした話者情報・タイムスタンプ付きシングルチャネル会話音声認識システムのための検討
   土屋 楓太,髙木 一幸

■SP
(16)人格,対話文脈,VADスコアを用いた音声感情認識のデータ拡張の検討
   山川 祥,佐々木 多希子

(17)微分可能鏡像法に基づく頭部・室内伝達関数の同時推定
   大庫 一真,上田 博之,伊藤 陽介,吉井 和佳

(18)微分可能鏡像法に基づく音源位置と室内音響特性の同時推定
   小澤 光太朗,伊藤 陽介,吉井 和佳

(19)Conv-TasNetを利用した笑い声に対する音声分離可能性の検証
   三宅 暁大,有本 泰子

(20)ドメイン特化型の知覚的報酬を用いた強化学習によるアニメスタイル音声合成の最適化
   朴 浚鎔,Jerry Li

■MUS
(21)口真似音声からの爆発音合成手法における入力音声のニュアンス反映性評価手法の検討
   滝沢 力,平井 重行,須田 仁志

(22)大規模言語モデルを用いた会話内容に基づく音楽推薦および自動再生システムとプロンプト設計考察
   山本 晴菜,馬場 哲晃

(23)Are Vocaloid Songs Getting Denser? A Longitudinal Audio Analysis of 1,900 Hatsune Miku Songs (2007-2025)
   Kaikwan Lau

(24)音楽ライブにおける奏者の移動に応じたパンとリバーブの動的制御によるライブ体験の向上
   鍋島 優太,小玉 周平

(25)DAWプロジェクトの構造的差分検出とバージョン管理システム
   伊藤 有汰,阿部 涼介,鈴木 茂哉

(26)歌唱者間の相互作用と個人の特性を考慮した音高・スペクトル制御による構成的斉唱音声合成
   馬場 開仁,齋藤 大輔,峯松 信明

■SLP
(27)ゼロショット音声合成を考慮した電子透かしの日本語実環境へのドメイン適応
   安藤 栄規,塩田 さやか

(28)TDOAに基づく段階的最適化による音源・マイク同時位置推定手法
   長谷川 祐希,糸山 克寿

(29)距離ベース時間マスキングと話者情報を組み合わせた二段階処理によるロバスト音声強調
   瀬高 亮,糸山 克寿

(30)感情的韻律が配慮表現としての感情比喩にもたらす効果
   小島 隆次,岡 隆之介

(31)「歌声の映し絵:《甲州三坂水面》の調べ」の制作
   内田 照久

■SP
(32)個人識別性を保った話者の属性編集
   関 侑太,篠田 浩一

(33)日本語日常会話コーパスを用いたマルチモーダル談話行為推定の検討
   牧岡 秀,山田 武志

(34)音声SSLモデルの潜在特徴の再構成に基づく音声感情認識の検討
   橋本 空,山田 武志

(35)移動する受音点に対する動的な時間応答の計算
   尾山 雄斗,元木 邦俊

(36)既知話者と未知話者の対話における音声認識を目的としたリアルタイム発話区間検出
   山本 恵子,大角 耕介,クリンキグト マルティン,諸菱 正典,荒川 隆行

■MUS
(37)TimbreStellar☆最高の音色♪を見つける星空探索
   米田 美優,山西 良典,伊藤 貴之

(38)メロディの特徴と日本語歌詞のモーラ出現頻度の比較調査
   宮内 隆利,森勢 将雅

(39)アカペラ曲の難易度に関する研究-情報量を用いた推定手法の提案と主観評価実験による比較-
   小梨 遥輝,飯野 なみ

(40)手の大きさを考慮した運指データベース構築に向けて:手の大きさによる運指の比較
   佐藤 熙,中村 栄太,齋藤 康之,饗庭 絵里子

■SLP
(41)Altered auditory feedbackにおける感情的音声変調の弁別閾測定
   中村 颯,福田 航希,高道 慎之介,大畑 龍

(42)ランダムスプライシングによる音声難読化の制約付与とドメイン適応の検討
   冨永 陽也,塩田 さやか

(43)ダークデータを活用した話者照合モデルの汎化性能向上の検討
   渡邊 真子,塩田 さやか

(44)聴覚フィードバック音声制御に向けた体内伝導自己聴取音マスキングの調査
   浪崎 恭佑,ホワン ウェンチン,戸田 智基

(45)深層話者埋め込みのためのドメイン情報の除去による話者照合精度の分析
   堤 歩斗,塩田 さやか

■SP
(46)拡散モデルを用いた自己教師あり事前学習による頑健な話者特徴表現の獲得
   三輪 海斗,篠田 浩一

(47)J-POPとK-POPはなにが違うのか?
   青木 直史

(48)高齢者の音声了解度における末梢系聴力損失とそれ以降の影響の分離
   入野 俊夫,山本 絢子,宮﨑 芙紀

(49)潜在拡散モデルを使用した叫び声合成の試み
   平尾 怜士,有本 泰子

(50)擬似空間埋め込みを用いた単一チャンネル音声分離
   二通 大地,篠田 浩一

(51)F0が欠落した音信号の雑音環境下での基本周波数推定
   靏 禎政,三輪 賢一郎

■MUS
(52)空間を捉える視聴覚技術:音響シーンの理解と生成
   島田 一希

(53)音学研究者が知っておくといいかもしれない難聴の知識
   倉片 憲治

(54)ロジスティック回帰を用いたゴーストノートのタイミング推定
   山下 雷蔵,福永 修一

(55)調情報を統合した分類型半制限ボルツマンマシンによる和音認識
   石川 峻弥,松山 美音,中鹿 亘

(56)シャドーイングに基づくジャズ聴取能力の定量的評価と学習効果の検証
   宮城 瑠翔,恩田 健太郎,齋藤 大輔,峯松 信明

(57)微分音の入力が可能なピアノロールを用いた主観的音階構築におけるピッチ選択傾向の分析
   岡﨑 真侍,平井 辰典

(58)楽曲の一部をもとに全体を自動生成するシステムの開発に向けて:セクションごとのコード進行における特徴の調査
   向山 智基,北原 鉄朗,饗庭 絵里子

(59)ヴァイオリン・ヴィオラ二重奏における一体感の形成過程—反復実践に基づく初期的検討—
   黒瀧 かれん,竹川 佳成,松原 正樹

■SLP
(60)Human Fooling Rateテストに基づく最先端の日本語テキスト音声合成モデルの評価および分析
   齋藤 佑樹,Huang Wen-Chin,榎本 悠久,今井 柊平

(61)音声基盤モデルは人間と同様の知覚的話者類似性を持つのか?
   八木 颯斗,岸 秀,高道 慎之介,齋藤 佑樹

(62)分岐構造ニューラルネットワークを用いた距離ベース音声強調とターゲット話者抽出の統合
   原田 竜成,糸山 克寿

(63)自己教師あり学習に基づく音声変換モデルを用いた骨導音声の明瞭度改善
   草田 晃彦,小澤 賢司,鳥谷 輝樹

(64)最大公約基本周波数に基づく重唱音声のソース・フィルタ分析と和音制御
   福地 柊斗,岡田 翔太,齋藤 大輔,峯松 信明

■SP
(65)三次元態度印象に基づく個人内基準フィードバックによる韻律自己調整訓練の基礎検討
   菅井 千鶴,菊池 浩史,菊池 英明

(66)大規模言語モデル蒸留とViseme補助学習を用いた視覚発話認識
   駒井 陽希,篠田 浩一

(67)表情筋への非侵襲的介入が発話者の心理状態および音声特性に与える影響
   野毛 葉子,大浦 杏奈,菊池 英明

(68)歴史的音源におけるF0推定の検討
   西野 嘉祥,三輪 賢一郎

(69)マルチモーダル3Dガウシアン表現に基づく同時的音源分離・3D形状復元
   浅野 陽生,坂東 宜昭,Aditya Arie Nugraha,伊藤 陽介,吉井 和佳

■MUS
(70)音楽ゲームにおける技能習得忘却メカニズムの解明
   吉田 颯平,松浦 実央,松原 正樹,平田 圭二,竹川 佳成

(71)実機システムにおける周波数特性補正による雑音抑圧の性能向上に向けた検討
   粟盛 智也,鳥谷 輝樹,小澤 賢司

(72)HPSS帯域分解に基づくIOIエントロピーによる音楽ジャンル識別力の分析
   清水 將吾

(73)音楽基盤モデルの学習過程における内在音高螺旋の解析
   佐藤 りん,田中 啓太郎,八木 颯斗,高道 慎之介,森島 繁生

(74)スピーカ受聴を再現する音像外在化の手がかり調査用バイノーラル音合成システム
   佐藤 徳,モクタリ パーハム,森川 大輔,岡崎 聡

(75)曲非依存な演奏者識別のための間の取り方とルバート特徴に基づく個人特性特徴量の設計
   能登 楓

■SLP
(76)漫画コマ画像からキャプション・写実画像を介した環境音合成
   岸 秀,越野 颯太,高道 慎之介

(77)吃音音声認識性能向上を目的とした日本語疑似吃音音声の作成方法の検討
   佐藤 なな子,熊倉 直哉,下村 結,高道 慎之介

(78)雑談型音声対話システムにおける環境音を活用した対話応答の検討
   藤本 亮一,原 直

(79)音響特徴量に基づくパーキンソン病患者の発話困難音素の特定に向けた検討
   篠田 陸斗,原 直,武本 麻美

(80)フレームレベル吃音検出における吃音特徴を効果的に捉えるモデル入力条件の検討
   藤田 康平,原 直,小川 厚徳

(81)声優の模倣した動物の鳴き声の音響特徴調整の基礎分析
   吉成 萌夏,幸島 匡宏

■SP
(82)分散型マイク・カメラアレイを用いた階層的生成モデルに基づく移動音源追跡・分離
   二瓶 竜乃介,坂東 宜昭,Aditya Arie Nugraha,伊藤 陽介,吉井 和佳

(83)Cross-layer recurrent processing of Residual Vector Quantization layers for Audio Codec-based Speech Separation
   Phuong Dinh Nhu Minh,Roland Hartanto,Koichi Shinoda

(84)対照学習と変分正則化に基づく繰り返し測定脳波からの音声デコーディング
   水野 友暁,中鹿 亘

(85)Revisiting Mode Dependence in the Zipformer for Unified Streaming and Offline ASR
   Wen Shen Teo,Yasuhiro Minami

■MUS
(86)混合Differentiable Digital Signal Processingモデルに基づくガイダンスを用いた拡散モデルによる合成パラメータ推定
   竹本 健悟,中村 友彦,猿渡 洋

(87)縮小ダミーヘッドを用いた正中面における頭部伝達関数の計測
   松永 悠幹,森川 大輔,モクタリ パーハム,岡崎 聡

(88)他人の頭部模型で収録した後方音源の距離知覚に頭部運動が与える影響
   谷口 翼,森川 大輔,岡崎 聡,モクタリ パーハム

■SLP
(89)教師あり対照学習と2分岐構造による音源情報と空間情報の分離表現学習
   上治 正太郎,高道 慎之介,山岡 洸瑛

(90)「なぜ自分の声は気持ち悪い?」再生・想起のギャップと個人特性・音声特徴の影響に関する大規模実験
   福田 航希,高道 慎之介

(91)長野県下伊那方言音声コーパスの構築と音声合成の評価
   篠田 良太,高道 慎之介

(92)声を介した身体性認知についての検討-Voice Ownership IllusionとThe Parakeet Effectから見る身体性認知-
   國見 友亮,持丸 正明

(93)音声のキャラクタ性設計に向けた役割語の文末表現および感動詞に関する印象評価
   劉 承旻,林 大輔,辻野 雄大,森勢 将雅

(94)視聴覚を共有した大規模言語モデルを用いた英会話システムの構築と評価~研究現場における英会話能力の向上を目指して~
   鴫 正典,陳 際諾,齋藤 大輔,峯松 信明

(95)意味的類似度に基づいた応答プリフェッチを組み込んだリアルタイム音声対話システム
   森 清忠,アンヘル ガルシア コントレラス,河野 誠也,吉野 幸一郎

■SP
(96)Speech-laughの発生機序の解明に向けた言語普遍性の検証実験の検討
   谷村 拓哉,有本 泰子

(97)MDNを用いた多様なビッグファイブ特性音声合成の基礎的検討
   成川 颯真,水野 友暁,中鹿 亘

(98)非侵襲型脳波信号を用いた音声合成におけるアライメント手法の比較検討
   阪口 知玖,水野 友暁,中鹿 亘

(99)音声合成における叫び声を多様に制御可能とする潜在表現の学習
   有馬 秀星,森 大毅

■SLP
(100)研究費クラファンの話をしよう
   高道 慎之介

一括ダウンロード