第156回音声言語情報処理研究発表会

プログラム詳細は以下をご参照ください。
https://www.ipsj.or.jp/kenkyukai/event/slp156.html

（1）「音学シンポジウム2025」開催にあたって
　　　大町基，南角吉彦，中村栄太，吉井和佳，森川大輔，坂東宜昭

（2）公共メディアにおける音声技術の応用
　　　佐藤庄衛

（3）ニューラルボコーダ概説：生成モデルと実用性の観点から
　　　米山怜於

（4）音声研究の知見がニューラルボコーダの発展にもたらす効果
　　　戸田智基

（5）第1楽章kashika: GPTを活用した感情に基づく歌詞生成に関する検討
　　　原光希，大井翔

（6）周波数別音響刺激による味噌の発酵および味覚特性の変化分析
　　　圓山風夏，尼岡利崇，横山真男

（7）白色信号を仮定した高速H∞フィルタの計算量削減
　　　對馬颯，永田仁史

（8）制御性の高いピアノ自動編曲に向けた楽曲難易度指標の設計
　　　宮司光梨，澤田桂都，ホワンウェンチン，戸田智基

（9）リアルタイム笑い声・叫び声検出に対するstreaming音声認識の有効性の検証
　　　倉澤瑞，有本泰子

（10）MIDI-likeトークンを用いたseq2seqモデルによる鼻歌自動採譜
　　　八木颯斗，斎藤博昭

（11）音楽的制約を用いた音声合成の制御
　　　佐藤優芽，須藤克仁

（12）マルチモーダルDTWに基づいたピアノ演奏MIDIデータにおけるフレーズ・アーチングの分析
　　　小林未知数，高橋舞，中村栄太

（13）IRMとGTTMの相補的利用による階層的暗意実現の可視化
　　　澤村拓樹，橋田光代，片寄晴弘

（14）演劇の台本と役者の動きを用いたシーンに合うBGMの作曲支援の検討
　　　清水誠広，酒向慎司

（15）チャットボットの印象と読み上げ音声の加工強度との対応関係に関する分析
　　　井波竜介，宮本蓮，齋藤大輔，峯松信明

（16）大規模音声基盤モデルを用いた話し言葉から書き言葉へのEnd-to-End変換におけるテキスト整形
　　　松藤麻里，須藤克仁

（17）学習者自己聴取音の声質を有するモデル音声の合成とその発音学習効果
　　　山中涼雅，藤原朱里，耿浩彭，齋藤大輔，峯松信明，大佐健人，井上雄介

（18）ChatGPTと規則を用いた音声変化頻度の高い英文生成とそれを用いた聴取訓練
　　　瀧口流星，山中涼雅，齋藤大輔，峯松信明，中西のり子

（19）小学校の合唱指導に対する教員の課題感とニーズに関する予備的考察
　　　高橋優斗，飯野なみ

（20）複数エージェントのグルーヴ動作を用いた音楽動作体験における人数と動作の類似性の影響
　　　石田真子，後藤海璃，西野歩真，米澤朋子

（21）楽器演奏におけるマルチモーダル計測のための再利用可能な収録システム
　　　和田洋平，谷高幸司，小幡哲史，甲斐繁，上原春喜，庄司哲郎，有元慶太，前澤陽，高橋祐

（22）「歌う雑音」：多層動的バンドノイズ音声と高低反転メロディによる検証
　　　内田照久

（23）説明可能AIを用いた特徴分析に基づく環境音加工の検討
　　　曺龍平，西島大史，齋藤大輔，峯松信明

（24）ダウン症者を対象とした発声の自動評価に向けた基礎検討
　　　大串旭，北原鉄朗，三嶋博之

（25）LinkedMusic Project: Integrating Music Databases
　　　Ichiro Fujinaga

（26）環境音埋め込みベクトル系列の類似度に基づく環境音合成の自動評価
　　　岸秀，阪井瞭介，高道慎之介，金森勇介，岡本悠希

（27）順序を考慮したオーディオエフェクトチェインの推定に対する双曲埋め込み
　　　和田仰，中村友彦，猿渡洋

（28）作業フェーズに応じた音楽のテンポおよび音量調整と作業に対するモチベーションへの影響
　　　西口雄斗，喜多涼陽，石田真子，米澤朋子

（29）同じfoにおける地声ときしる声らしい音声の比較
　　　水澤秀哉，モクタリパーハム，岡崎聡，森川大輔

（30）他人の頭部形状を用いたバイノーラル収録音の音像の距離知覚に頭部運動が与える影響
　　　谷口翼，森川大輔，岡崎聡，モクタリパーハム

（31）プロンプトにより韻律と声質を制御する日本語テキスト音声合成システムのための検討
　　　伊佐早佳月，髙木一幸

（32）楽曲スコアデータの二次元画像への集約と可視化
　　　加藤さやか，石垣優弥，横山真男

（33）微分音を含む単純なメロディに対する主観評価結果の分析
　　　長川原颯人，平井辰典

（34）潜在変数と観測データにガンマ分布を仮定したVAEによる声質変換
　　　今市夏菜子，中鹿亘

（35）音素長と音高が歌声の印象評価に与える影響
　　　深澤実紅，北原玲奈，久保田新菜，志々目樹，戸田菜月，竹本浩典，高橋純

（36）単一チャンネル音声分離のためのマルチチャンネルモデルを用いた知識蒸留手法
　　　二通大地，ローランドハルタント，篠田浩一

（37）指動作入力に基づく会話支援システムのためのニューラル機械翻訳と生成AIを用いた入力文推定方式の検討
　　　岩崎茉理，阿部匡伸，原直

（38）舌亜全摘出者音声合成における他話者の健常音声と障害音声を用いた話者類似性向上の検討
　　　岡村優頼，阿部匡伸，原直

（39）非同期検波方式による音信号の基本周波数推定
　　　サンチェズション，三輪賢一郎

（40）口唇を簡素化した幾何学的形状モデルによる放射伝達特性の計算について
　　　佐藤千畝，元木邦俊

（41）音源物体の3Dガウス群表現に基づく多チャネル音源分離
　　　浅野陽生，坂東宜昭，吉井和佳

（42）時変空間モデルを用いた多チャネル非負値行列因子分解に基づく複数移動音源分離・追跡
　　　二瓶竜乃介，坂東宜昭，吉井和佳

（43）Consistency Trajectory Modelを用いた拡散モデル型声質変換の性能向上手法の検討
　　　畠山瑠一，中鹿亘

（44）音声資料の収録および提示におけるクラス分けと支援ツールの体系化の構想について
　　　河原英紀，榊原健一，水町光徳，北村達也，矢田部浩平

（45）独立低ランク行列分析のオンライン処理実現のための実験的評価
　　　中嶋大志

（46）音響・テキストマルチモーダル学習に基づくプロンプト可能な音響イベント検出
　　　神取雄大，櫻井舜，坂東宜昭，井本桂右，大西正輝

（47）遠隔発話音声認識のための音声強調フロントエンド：概要と我々の取り組み
　　　落合翼

（48）マルチモーダル大規模言語モデル入門
　　　小松亮太

（49）Deep Generative Models for Audio Applications
　　　Yuki Mitsufuji，Yuhta Takida

（50）人と人をつなぐリアルタイムコミュニケーションデバイス
　　　藤坂洋一

（51）言語非依存な口真似による効果音合成手法PronounSEの評価
　　　滝沢力，平井重行，金崎朝子，須田仁志

（52）バイノーラルマイクを用いた話者及び音源到来方向のリアルタイム同時推定
　　　大角耕介，大原健悟，山本恵子，山本絵里香，諸菱正典，荒川隆行

（53）テキスト音声合成における記号付与を用いた話者制御の実現可能性
　　　蟹江世莉奈，俣野文義，倉茂雄人，森勢将雅

（54）Lie Detection Based on Multimodal Fusion: A Case Study of Court Trial Video Dataset
　　　Ting Xu，Nobuaki Minematsu，Daisuke Saito

（55）日英のヒットチャートはどのように世情を映すか？楽曲指標と社会・経済指標の関連性から見る傾向の違い（第142回MUS研究発表会にて報告）
　　　秋本啓志，及川靖広，菅野由弘，森本洋太

（56）歌詞の明瞭性と伝達性のための客観的評価手法に向けた音声認識言語ベースの合唱分析
　　　加藤早希，小原祥与，三浦寛也，渡邉拓貴，竹川佳成

（57）音楽表現を考慮した自動採譜のための深層学習に基づく強弱記号の推定
　　　文野太陽，實廣貴敏

（58）Wikipedia情報に基づく漫画推薦アルゴリズム
　　　松本一途，斎藤博昭

（59）Detecting Pause Anomalies in Read Japanese L2 Speech
　　　Stephen Mcintosh，Daisuke Saito，Nobuaki Minematsu

（60）複数のランダム直交行列に基づく秘密鍵による音声プライバシー保護法の適用要件緩和と攻撃耐性評価
　　　田中康平，貴家仁志，塩田さやか

（61）対照学習による顔画像と音声のモデル化に基づくクロスモーダル音声合成
　　　山田美晴，橋本佳，南角吉彦，徳田恵一

（62）無歌唱区間を考慮した楽曲構成変化のタイミング推定手法の提案
　　　三上拓寛，白石陽

（63）自己教師あり学習に基づく声質変換におけるモデルと性別の影響分析
　　　山下凜，能勢隆，小林清流，伊藤彰則

（64）マルチチャネルなりすまし音声検出における自己教師あり学習フロントエンドの有効性検証
　　　山口拓生，俵直弘，塩田さやか

（65）歌唱可能性の定量化に向けた一検討：跳躍やBPMに着目した分析
　　　川原未波，北原鉄朗

（66）演奏時間とダイナミクスの視点によるテンポ・ルバートの実践分析
　　　鷲野彰子

（67）インバータ音のスペクトル解析に基づく三相交流モータ動作状態推定
　　　白井成彦，森大毅

（68）身体動作と呼吸分析による表現力豊かなピアノ演奏の研究
　　　鏡味ほのか，飯野なみ，伊集院幸輝，押山千秋，中村嘉志，西村拓一

（69）延長的簡約木の自動生成とその評価手法の検討
　　　堀口楓佳，水谷哲也

（70）小規模データを用いた楽曲補完手法の分析
　　　苗村公明，永瀬亮太郎，高島遼一，山下洋一

（71）F2S-SBV2：任意のアニメ調キャラクター顔画像に適した話者性を有するテキスト音声合成の検討
　　　菊池遥斗，能勢隆，林崎由，小林清流，橋本佳，伊藤彰則

（72）CP分解に基づくスコアテンソルとNeural Semi-CRFを用いた多楽器自動採譜の検討
　　　石川峻弥，山本麟太郎，中鹿亘

（73）微分音コードが発音可能なXR弦楽器システムの構築と評価
　　　安引海翔，長川原颯人，青柳西蔵，服部哲，平井辰典

（74）音声トークンの言語に関する分析
　　　朴浚鎔，高道慎之介，David M. Chan，神藤駿介，齋藤佑樹，猿渡洋

（75）重み付きAttentionのアライメント機構を用いた系列変換型声質変換
　　　山下陽生，岡本拓磨，高島遼一，大谷大和，滝口哲也，戸田智基，河井恒

（76）身体で掴む間合い─インタラクティブメディアによる音楽合奏の間合い体得支援と効果検証
　　　黒瀧かれん，三上薫，竹川佳成，松原正樹

（77）日本語諸方言音声の韻律的特徴に着目した地域性分析のための大規模自己教師あり学習モデルの活用
　　　遠山拓実，田中孝祐，甲斐充彦，中川聖一

（78）日本語諸方言音声認識における大規模多言語事前学習モデルの比較と適応手法の検討
　　　高橋尚希，淺川夏生瑠，ナハルラウフン，甲斐充彦，中川聖一

（79）Audio Spectrogram Transformerを用いた演奏家分類
　　　上治正太郎，斎藤博昭

（80）和音性の定量的評価モデルに基づく和音タイプ別認識特性の分析
　　　植村あい子

（81）楽曲の全体構造を構築可能なマルチトラック音楽生成
　　　小原勇輝，小林哲則，小坂直敏

（82）コミュニケーションロボットの交替潜時と動作が対話の円滑性に与える影響
　　　朱凱，北村達也，梅谷智弘

（83）音響タギングとセマンティック地図に基づく大規模言語モデルを用いた大域的自己位置推定
　　　尾崎晴美，坂東宜昭，佐々木洋子，大西正輝

（84）オープンドメイン視聴覚データセットの構築と汎用視聴覚音響イベント物体検出への応用
　　　櫻井舜，坂東宜昭，井本桂右，大西正輝

（85）離散音声トークンを活用した歌声合成システムの開発に向けた音響モデルと特徴量の検討
　　　有田諒子，中田亘，山内一輝，関健太郎，楊棟，齋藤佑樹，猿渡洋

（86）世界諸英語話者間の相互シャドーイングと話者・聴取者間の音声的差異に基づく聴取崩れの要因分析
　　　藤原朱里，峯松信明，中西のりこ，齋藤大輔

（87）最適輸送を用いた音素事後確率分布の比較と低リソース言語の発話比較への応用
　　　大佐健人，孫海童，峯松信明，齋藤大輔

（88）多様なシミュレーション音場における教師あり仮想マイクロホンアレイ信号推定の汎化性能評価
　　　服部公宏，Huang Wen-Chin，武田一哉，戸田智基

（89）ステアリングベクトル推定に基づく自動焦点ニューラルビームフォーマの検討
　　　丸川怜也，山田武志

（90）JATTS: A Comparison-oriented Japanese Text-to-speech Open-sourced Toolkit
　　　Wen-Chin Huang，Lester Violeta，Tomoki Toda

（91）音声プライバシー保護のための敵対的サンプル生成と異なる話者埋め込み抽出器間における転移性評価
　　　中村幸多郎，中鹿亘

（92）SpREAD：日本語連続音声聴取時の繰り返し測定頭皮脳波データセット
　　　水野友暁，櫻井芳騎，吉村奈津江，中鹿亘

（93）人の可能性を解き放つ対話型診断AIエージェントの開発
　　　松山洋一

一括ダウンロード

音声言語情報処理（SLP）へ戻る

このページの先頭へ