第160回音声言語情報処理研究発表会

プログラム詳細は以下をご参照ください。
https://www.ipsj.or.jp/kenkyukai/event/slp160.html

■MUS
（1）「音学シンポジウム2026」開催にあたって
　　　中村栄太，吉井和佳，柏木陽佑，中鹿亘，上江洲安史，井本桂右

（2）音楽データサイエンスにおける演奏科学研究の取り組み
　　　三浦雅展，竹下和秀

（3）シングルチャネルマルチトーカー音声認識の進展
　　　増村亮

（4） K-POPにおける歌詞構造と音楽的区切りの不一致が生み出す表現効果の分析
　　　鈴木源吾，安達萌衣

（5）楽曲の文脈情報理解に向けたマルチモーダル大規模言語モデルによる楽曲同定能力の検討
　　　竹本健悟，蓮実拓也，Welly Naptali，和気雅弥，橘健太郎

（6） Tonal Pitch Spaceによる和音間距離の音楽的解釈-第2報-
　　　山口直彦，北原鉄朗

（7）歌詞を時間軸アンカーとするヴァイオリン演奏支援記譜インタフェース「さくら譜」の設計と実装～既知の楽曲における五線譜の読譜プロセスの代替・補完～
　　　小林さくら

（8）モジュール分離型アーキテクチャによるオーディオエフェクト設定逆推定
　　　デポンテスジェフェルソンマコト，ホワンウェンチン，戸田智基

（9）サッカーの試合における試合状況を考慮した群衆歓声音の生成手法の検討
　　　長谷川和希，小玉周平

■SLP
（10）環境音イベント検出におけるVariational Autoencoderを用いた入力音の適合度判定に関する検討
　　　高見陽斗，原直

（11）キャラクター画像を用いた日本語テキスト音声合成の声質制御
　　　周廷叡，柳井啓司

（12）口唇映像を用いたマルチモーダル音声認識における構音障害者のための話者適応の検討
　　　木山大輔，原直

（13）自然文で声質制御可能なTTSにおける音声トークン列予測のLMの違いによる比較
　　　伊佐早佳月，髙木一幸

（14）混合正規分布条件付け拡散確率モデルベース声質変換
　　　岸田拓也，中鹿亘

（15）Whisperを基盤とした話者情報・タイムスタンプ付きシングルチャネル会話音声認識システムのための検討
　　　土屋楓太，髙木一幸

■SP
（16）人格,対話文脈,VADスコアを用いた音声感情認識のデータ拡張の検討
　　　山川祥，佐々木多希子

（17）微分可能鏡像法に基づく頭部・室内伝達関数の同時推定
　　　大庫一真，上田博之，伊藤陽介，吉井和佳

（18）微分可能鏡像法に基づく音源位置と室内音響特性の同時推定
　　　小澤光太朗，伊藤陽介，吉井和佳

（19）Conv-TasNetを利用した笑い声に対する音声分離可能性の検証
　　　三宅暁大，有本泰子

（20）ドメイン特化型の知覚的報酬を用いた強化学習によるアニメスタイル音声合成の最適化
　　　朴浚鎔，Jerry Li

■MUS
（21）口真似音声からの爆発音合成手法における入力音声のニュアンス反映性評価手法の検討
　　　滝沢力，平井重行，須田仁志

（22）大規模言語モデルを用いた会話内容に基づく音楽推薦および自動再生システムとプロンプト設計考察
　　　山本晴菜，馬場哲晃

（23）Are Vocaloid Songs Getting Denser? A Longitudinal Audio Analysis of 1,900 Hatsune Miku Songs (2007-2025)
　　　Kaikwan Lau

（24）音楽ライブにおける奏者の移動に応じたパンとリバーブの動的制御によるライブ体験の向上
　　　鍋島優太，小玉周平

（25）DAWプロジェクトの構造的差分検出とバージョン管理システム
　　　伊藤有汰，阿部涼介，鈴木茂哉

（26）歌唱者間の相互作用と個人の特性を考慮した音高・スペクトル制御による構成的斉唱音声合成
　　　馬場開仁，齋藤大輔，峯松信明

■SLP
（27）ゼロショット音声合成を考慮した電子透かしの日本語実環境へのドメイン適応
　　　安藤栄規，塩田さやか

（28）TDOAに基づく段階的最適化による音源・マイク同時位置推定手法
　　　長谷川祐希，糸山克寿

（29）距離ベース時間マスキングと話者情報を組み合わせた二段階処理によるロバスト音声強調
　　　瀬高亮，糸山克寿

（30）感情的韻律が配慮表現としての感情比喩にもたらす効果
　　　小島隆次，岡隆之介

（31）「歌声の映し絵：《甲州三坂水面》の調べ」の制作
　　　内田照久

■SP
（32）個人識別性を保った話者の属性編集
　　　関侑太，篠田浩一

（33）日本語日常会話コーパスを用いたマルチモーダル談話行為推定の検討
　　　牧岡秀，山田武志

（34）音声SSLモデルの潜在特徴の再構成に基づく音声感情認識の検討
　　　橋本空，山田武志

（35）移動する受音点に対する動的な時間応答の計算
　　　尾山雄斗，元木邦俊

（36）既知話者と未知話者の対話における音声認識を目的としたリアルタイム発話区間検出
　　　山本恵子，大角耕介，クリンキグトマルティン，諸菱正典，荒川隆行

■MUS
（37）TimbreStellar☆最高の音色♪を見つける星空探索
　　　米田美優，山西良典，伊藤貴之

（38）メロディの特徴と日本語歌詞のモーラ出現頻度の比較調査
　　　宮内隆利，森勢将雅

（39）アカペラ曲の難易度に関する研究-情報量を用いた推定手法の提案と主観評価実験による比較-
　　　小梨遥輝，飯野なみ

（40）手の大きさを考慮した運指データベース構築に向けて：手の大きさによる運指の比較
　　　佐藤熙，中村栄太，齋藤康之，饗庭絵里子

■SLP
（41）Altered auditory feedbackにおける感情的音声変調の弁別閾測定
　　　中村颯，福田航希，高道慎之介，大畑龍

（42）ランダムスプライシングによる音声難読化の制約付与とドメイン適応の検討
　　　冨永陽也，塩田さやか

（43）ダークデータを活用した話者照合モデルの汎化性能向上の検討
　　　渡邊真子，塩田さやか

（44）聴覚フィードバック音声制御に向けた体内伝導自己聴取音マスキングの調査
　　　浪崎恭佑，ホワンウェンチン，戸田智基

（45）深層話者埋め込みのためのドメイン情報の除去による話者照合精度の分析
　　　堤歩斗，塩田さやか

■SP
（46）拡散モデルを用いた自己教師あり事前学習による頑健な話者特徴表現の獲得
　　　三輪海斗，篠田浩一

（47）J-POPとK-POPはなにが違うのか？
　　　青木直史

（48）高齢者の音声了解度における末梢系聴力損失とそれ以降の影響の分離
　　　入野俊夫，山本絢子，宮﨑芙紀

（49）潜在拡散モデルを使用した叫び声合成の試み
　　　平尾怜士，有本泰子

（50）擬似空間埋め込みを用いた単一チャンネル音声分離
　　　二通大地，篠田浩一

（51）F0が欠落した音信号の雑音環境下での基本周波数推定
　　　靏禎政，三輪賢一郎

■MUS
（52）空間を捉える視聴覚技術：音響シーンの理解と生成
　　　島田一希

（53）音学研究者が知っておくといいかもしれない難聴の知識
　　　倉片憲治

（54）ロジスティック回帰を用いたゴーストノートのタイミング推定
　　　山下雷蔵，福永修一

（55）調情報を統合した分類型半制限ボルツマンマシンによる和音認識
　　　石川峻弥，松山美音，中鹿亘

（56）シャドーイングに基づくジャズ聴取能力の定量的評価と学習効果の検証
　　　宮城瑠翔，恩田健太郎，齋藤大輔，峯松信明

（57）微分音の入力が可能なピアノロールを用いた主観的音階構築におけるピッチ選択傾向の分析
　　　岡﨑真侍，平井辰典

（58）楽曲の一部をもとに全体を自動生成するシステムの開発に向けて：セクションごとのコード進行における特徴の調査
　　　向山智基，北原鉄朗，饗庭絵里子

（59）ヴァイオリン・ヴィオラ二重奏における一体感の形成過程—反復実践に基づく初期的検討—
　　　黒瀧かれん，竹川佳成，松原正樹

■SLP
（60）Human Fooling Rateテストに基づく最先端の日本語テキスト音声合成モデルの評価および分析
　　　齋藤佑樹，Huang Wen-Chin，榎本悠久，今井柊平

（61）音声基盤モデルは人間と同様の知覚的話者類似性を持つのか？
　　　八木颯斗，岸秀，高道慎之介，齋藤佑樹

（62）分岐構造ニューラルネットワークを用いた距離ベース音声強調とターゲット話者抽出の統合
　　　原田竜成，糸山克寿

（63）自己教師あり学習に基づく音声変換モデルを用いた骨導音声の明瞭度改善
　　　草田晃彦，小澤賢司，鳥谷輝樹

（64）最大公約基本周波数に基づく重唱音声のソース・フィルタ分析と和音制御
　　　福地柊斗，岡田翔太，齋藤大輔，峯松信明

■SP
（65）三次元態度印象に基づく個人内基準フィードバックによる韻律自己調整訓練の基礎検討
　　　菅井千鶴，菊池浩史，菊池英明

（66）大規模言語モデル蒸留とViseme補助学習を用いた視覚発話認識
　　　駒井陽希，篠田浩一

（67）表情筋への非侵襲的介入が発話者の心理状態および音声特性に与える影響
　　　野毛葉子，大浦杏奈，菊池英明

（68）歴史的音源におけるF0推定の検討
　　　西野嘉祥，三輪賢一郎

（69）マルチモーダル3Dガウシアン表現に基づく同時的音源分離・3D形状復元
　　　浅野陽生，坂東宜昭，Aditya Arie Nugraha，伊藤陽介，吉井和佳

■MUS
（70）音楽ゲームにおける技能習得忘却メカニズムの解明
　　　吉田颯平，松浦実央，松原正樹，平田圭二，竹川佳成

（71）実機システムにおける周波数特性補正による雑音抑圧の性能向上に向けた検討
　　　粟盛智也，鳥谷輝樹，小澤賢司

（72）HPSS帯域分解に基づくIOIエントロピーによる音楽ジャンル識別力の分析
　　　清水將吾

（73）音楽基盤モデルの学習過程における内在音高螺旋の解析
　　　佐藤りん，田中啓太郎，八木颯斗，高道慎之介，森島繁生

（74）スピーカ受聴を再現する音像外在化の手がかり調査用バイノーラル音合成システム
　　　佐藤徳，モクタリパーハム，森川大輔，岡崎聡

（75）曲非依存な演奏者識別のための間の取り方とルバート特徴に基づく個人特性特徴量の設計
　　　能登楓

■SLP
（76）漫画コマ画像からキャプション・写実画像を介した環境音合成
　　　岸秀，越野颯太，高道慎之介

（77）吃音音声認識性能向上を目的とした日本語疑似吃音音声の作成方法の検討
　　　佐藤なな子，熊倉直哉，下村結，高道慎之介

（78）雑談型音声対話システムにおける環境音を活用した対話応答の検討
　　　藤本亮一，原直

（79）音響特徴量に基づくパーキンソン病患者の発話困難音素の特定に向けた検討
　　　篠田陸斗，原直，武本麻美

（80）フレームレベル吃音検出における吃音特徴を効果的に捉えるモデル入力条件の検討
　　　藤田康平，原直，小川厚徳

（81）声優の模倣した動物の鳴き声の音響特徴調整の基礎分析
　　　吉成萌夏，幸島匡宏

■SP
（82）分散型マイク・カメラアレイを用いた階層的生成モデルに基づく移動音源追跡・分離
　　　二瓶竜乃介，坂東宜昭，Aditya Arie Nugraha，伊藤陽介，吉井和佳

（83）Cross-layer recurrent processing of Residual Vector Quantization layers for Audio Codec-based Speech Separation
　　　Phuong Dinh Nhu Minh，Roland Hartanto，Koichi Shinoda

（84）対照学習と変分正則化に基づく繰り返し測定脳波からの音声デコーディング
　　　水野友暁，中鹿亘

（85）Revisiting Mode Dependence in the Zipformer for Unified Streaming and Offline ASR
　　　Wen Shen Teo，Yasuhiro Minami

■MUS
（86）混合Differentiable Digital Signal Processingモデルに基づくガイダンスを用いた拡散モデルによる合成パラメータ推定
　　　竹本健悟，中村友彦，猿渡洋

（87）縮小ダミーヘッドを用いた正中面における頭部伝達関数の計測
　　　松永悠幹，森川大輔，モクタリパーハム，岡崎聡

（88）他人の頭部模型で収録した後方音源の距離知覚に頭部運動が与える影響
　　　谷口翼，森川大輔，岡崎聡，モクタリパーハム

■SLP
（89）教師あり対照学習と2分岐構造による音源情報と空間情報の分離表現学習
　　　上治正太郎，高道慎之介，山岡洸瑛

（90）「なぜ自分の声は気持ち悪い？」再生・想起のギャップと個人特性・音声特徴の影響に関する大規模実験
　　　福田航希，高道慎之介

（91）長野県下伊那方言音声コーパスの構築と音声合成の評価
　　　篠田良太，高道慎之介

（92）声を介した身体性認知についての検討-Voice Ownership IllusionとThe Parakeet Effectから見る身体性認知-
　　　國見友亮，持丸正明

（93）音声のキャラクタ性設計に向けた役割語の文末表現および感動詞に関する印象評価
　　　劉承旻，林大輔，辻野雄大，森勢将雅

（94）視聴覚を共有した大規模言語モデルを用いた英会話システムの構築と評価～研究現場における英会話能力の向上を目指して～
　　　鴫正典，陳際諾，齋藤大輔，峯松信明

（95）意味的類似度に基づいた応答プリフェッチを組み込んだリアルタイム音声対話システム
　　　森清忠，アンヘルガルシアコントレラス，河野誠也，吉野幸一郎

■SP
（96）Speech-laughの発生機序の解明に向けた言語普遍性の検証実験の検討
　　　谷村拓哉，有本泰子

（97）MDNを用いた多様なビッグファイブ特性音声合成の基礎的検討
　　　成川颯真，水野友暁，中鹿亘

（98）非侵襲型脳波信号を用いた音声合成におけるアライメント手法の比較検討
　　　阪口知玖，水野友暁，中鹿亘

（99）音声合成における叫び声を多様に制御可能とする潜在表現の学習
　　　有馬秀星，森大毅

■SLP
（100）研究費クラファンの話をしよう
　　　高道慎之介

一括ダウンロード

音声言語情報処理（SLP）へ戻る

このページの先頭へ