第156回音声言語情報処理研究発表会

プログラム詳細は以下をご参照ください。
https://www.ipsj.or.jp/kenkyukai/event/slp156.html


(1) 「音学シンポジウム2025」開催にあたって
   大町 基,南角 吉彦,中村 栄太,吉井 和佳,森川 大輔,坂東 宜昭

(2) 公共メディアにおける音声技術の応用
   佐藤 庄衛

(3) ニューラルボコーダ概説:生成モデルと実用性の観点から
   米山 怜於

(4) 音声研究の知見がニューラルボコーダの発展にもたらす効果
   戸田 智基

(5) 第1楽章kashika: GPTを活用した感情に基づく歌詞生成に関する検討
   原 光希,大井 翔

(6) 周波数別音響刺激による味噌の発酵および味覚特性の変化分析
   圓山 風夏,尼岡 利崇,横山 真男

(7) 白色信号を仮定した高速H∞フィルタの計算量削減
   對馬 颯,永田 仁史

(8) 制御性の高いピアノ自動編曲に向けた楽曲難易度指標の設計
   宮司 光梨,澤田 桂都,ホワン ウェンチン,戸田 智基

(9) リアルタイム笑い声・叫び声検出に対するstreaming音声認識の有効性の検証
   倉澤 瑞,有本 泰子

(10)MIDI-likeトークンを用いたseq2seqモデルによる鼻歌自動採譜
   八木 颯斗,斎藤 博昭

(11)音楽的制約を用いた音声合成の制御
   佐藤 優芽,須藤 克仁

(12)マルチモーダルDTWに基づいたピアノ演奏MIDIデータにおけるフレーズ・アーチングの分析
   小林 未知数,高橋 舞,中村 栄太

(13)IRMとGTTMの相補的利用による階層的暗意実現の可視化
   澤村 拓樹,橋田 光代,片寄 晴弘

(14)演劇の台本と役者の動きを用いたシーンに合うBGMの作曲支援の検討
   清水 誠広,酒向 慎司

(15)チャットボットの印象と読み上げ音声の加工強度との対応関係に関する分析
   井波 竜介,宮本 蓮,齋藤 大輔,峯松 信明

(16)大規模音声基盤モデルを用いた話し言葉から書き言葉へのEnd-to-End変換におけるテキスト整形
   松藤 麻里,須藤 克仁

(17)学習者自己聴取音の声質を有するモデル音声の合成とその発音学習効果
   山中 涼雅,藤原 朱里,耿 浩彭,齋藤 大輔,峯松 信明,大佐 健人,井上 雄介

(18)ChatGPTと規則を用いた音声変化頻度の高い英文生成とそれを用いた聴取訓練
   瀧口 流星,山中 涼雅,齋藤 大輔,峯松 信明,中西 のり子

(19)小学校の合唱指導に対する教員の課題感とニーズに関する予備的考察
   高橋 優斗,飯野 なみ

(20)複数エージェントのグルーヴ動作を用いた音楽動作体験における人数と動作の類似性の影響
   石田 真子,後藤 海璃,西野 歩真,米澤 朋子

(21)楽器演奏におけるマルチモーダル計測のための再利用可能な収録システム
   和田 洋平,谷高 幸司,小幡 哲史,甲斐 繁,上原 春喜,庄司 哲郎,有元 慶太,前澤 陽,高橋 祐

(22)「歌う雑音」:多層動的バンドノイズ音声と高低反転メロディによる検証
   内田 照久

(23)説明可能AIを用いた特徴分析に基づく環境音加工の検討
   曺 龍平,西島 大史,齋藤 大輔,峯松 信明

(24)ダウン症者を対象とした発声の自動評価に向けた基礎検討
   大串 旭,北原 鉄朗,三嶋 博之

(25)LinkedMusic Project: Integrating Music Databases
   Ichiro Fujinaga

(26)環境音埋め込みベクトル系列の類似度に基づく環境音合成の自動評価
   岸 秀,阪井 瞭介,高道 慎之介,金森 勇介,岡本 悠希

(27)順序を考慮したオーディオエフェクトチェインの推定に対する双曲埋め込み
   和田 仰,中村 友彦,猿渡 洋

(28)作業フェーズに応じた音楽のテンポおよび音量調整と作業に対するモチベーションへの影響
   西口 雄斗,喜多 涼陽,石田 真子,米澤 朋子

(29)同じfoにおける地声ときしる声らしい音声の比較
   水澤 秀哉,モクタリ パーハム,岡崎 聡,森川 大輔

(30)他人の頭部形状を用いたバイノーラル収録音の音像の距離知覚に頭部運動が与える影響
   谷口 翼,森川 大輔,岡崎 聡,モクタリ パーハム

(31)プロンプトにより韻律と声質を制御する日本語テキスト音声合成システムのための検討
   伊佐早 佳月,髙木 一幸

(32)楽曲スコアデータの二次元画像への集約と可視化
   加藤 さやか,石垣 優弥,横山 真男

(33)微分音を含む単純なメロディに対する主観評価結果の分析
   長川原 颯人,平井 辰典

(34)潜在変数と観測データにガンマ分布を仮定したVAEによる声質変換
   今市 夏菜子,中鹿 亘

(35)音素長と音高が歌声の印象評価に与える影響
   深澤 実紅,北原 玲奈,久保田 新菜,志々目 樹,戸田 菜月,竹本 浩典,高橋 純

(36)単一チャンネル音声分離のためのマルチチャンネルモデルを用いた知識蒸留手法
   二通 大地,ローランド ハルタント,篠田 浩一

(37)指動作入力に基づく会話支援システムのためのニューラル機械翻訳と生成AIを用いた入力文推定方式の検討
   岩崎 茉理,阿部 匡伸,原 直

(38)舌亜全摘出者音声合成における他話者の健常音声と障害音声を用いた話者類似性向上の検討
   岡村 優頼,阿部 匡伸,原 直

(39)非同期検波方式による音信号の基本周波数推定
   サンチェズ ション,三輪 賢一郎

(40)口唇を簡素化した幾何学的形状モデルによる放射伝達特性の計算について
   佐藤 千畝,元木 邦俊

(41)音源物体の3Dガウス群表現に基づく多チャネル音源分離
   浅野 陽生,坂東 宜昭,吉井 和佳

(42)時変空間モデルを用いた多チャネル非負値行列因子分解に基づく複数移動音源分離・追跡
   二瓶 竜乃介,坂東 宜昭,吉井 和佳

(43)Consistency Trajectory Modelを用いた拡散モデル型声質変換の性能向上手法の検討
   畠山 瑠一,中鹿 亘

(44)音声資料の収録および提示におけるクラス分けと支援ツールの体系化の構想について
   河原 英紀,榊原 健一,水町 光徳,北村 達也,矢田部 浩平

(45)独立低ランク行列分析のオンライン処理実現のための実験的評価
   中嶋 大志

(46)音響・テキストマルチモーダル学習に基づくプロンプト可能な音響イベント検出
   神取 雄大,櫻井 舜,坂東 宜昭,井本 桂右,大西 正輝

(47)遠隔発話音声認識のための音声強調フロントエンド:概要と我々の取り組み
   落合 翼

(48)マルチモーダル大規模言語モデル入門
   小松 亮太

(49)Deep Generative Models for Audio Applications
   Yuki Mitsufuji,Yuhta Takida

(50)人と人をつなぐリアルタイムコミュニケーションデバイス
   藤坂 洋一

(51)言語非依存な口真似による効果音合成手法PronounSEの評価
   滝沢 力,平井 重行,金崎 朝子,須田 仁志

(52)バイノーラルマイクを用いた話者及び音源到来方向のリアルタイム同時推定
   大角 耕介,大原 健悟,山本 恵子,山本 絵里香,諸菱 正典,荒川 隆行

(53)テキスト音声合成における記号付与を用いた話者制御の実現可能性
   蟹江 世莉奈,俣野 文義,倉茂 雄人,森勢 将雅

(54)Lie Detection Based on Multimodal Fusion: A Case Study of Court Trial Video Dataset
   Ting Xu,Nobuaki Minematsu,Daisuke Saito

(55)日英のヒットチャートはどのように世情を映すか?楽曲指標と社会・経済指標の関連性から見る傾向の違い(第142回MUS研究発表会にて報告)
   秋本 啓志,及川 靖広,菅野 由弘,森本 洋太

(56)歌詞の明瞭性と伝達性のための客観的評価手法に向けた音声認識言語ベースの合唱分析
   加藤 早希,小原 祥与,三浦 寛也,渡邉 拓貴,竹川 佳成

(57)音楽表現を考慮した自動採譜のための深層学習に基づく強弱記号の推定
   文野 太陽,實廣 貴敏

(58)Wikipedia情報に基づく漫画推薦アルゴリズム
   松本 一途,斎藤 博昭

(59)Detecting Pause Anomalies in Read Japanese L2 Speech
   Stephen Mcintosh,Daisuke Saito,Nobuaki Minematsu

(60)複数のランダム直交行列に基づく秘密鍵による音声プライバシー保護法の適用要件緩和と攻撃耐性評価
   田中 康平,貴家 仁志,塩田 さやか

(61)対照学習による顔画像と音声のモデル化に基づくクロスモーダル音声合成
   山田 美晴,橋本 佳,南角 吉彦,徳田 恵一

(62)無歌唱区間を考慮した楽曲構成変化のタイミング推定手法の提案
   三上 拓寛,白石 陽

(63)自己教師あり学習に基づく声質変換におけるモデルと性別の影響分析
   山下 凜,能勢 隆,小林 清流,伊藤 彰則

(64)マルチチャネルなりすまし音声検出における自己教師あり学習フロントエンドの有効性検証
   山口 拓生,俵 直弘,塩田 さやか

(65)歌唱可能性の定量化に向けた一検討:跳躍やBPMに着目した分析
   川原 未波,北原 鉄朗

(66)演奏時間とダイナミクスの視点によるテンポ・ルバートの実践分析
   鷲野 彰子

(67)インバータ音のスペクトル解析に基づく三相交流モータ動作状態推定
   白井 成彦,森 大毅

(68)身体動作と呼吸分析による表現力豊かなピアノ演奏の研究
   鏡味 ほのか,飯野 なみ,伊集院 幸輝,押山 千秋,中村 嘉志,西村 拓一

(69)延長的簡約木の自動生成とその評価手法の検討
   堀口 楓佳,水谷 哲也

(70)小規模データを用いた楽曲補完手法の分析
   苗村 公明,永瀬 亮太郎,高島 遼一,山下 洋一

(71)F2S-SBV2:任意のアニメ調キャラクター顔画像に適した話者性を有するテキスト音声合成の検討
   菊池 遥斗,能勢 隆,林崎 由,小林 清流,橋本 佳,伊藤 彰則

(72)CP分解に基づくスコアテンソルとNeural Semi-CRFを用いた多楽器自動採譜の検討
   石川 峻弥,山本 麟太郎,中鹿 亘

(73)微分音コードが発音可能なXR弦楽器システムの構築と評価
   安引 海翔,長川原 颯人,青柳 西蔵,服部 哲,平井 辰典

(74)音声トークンの言語に関する分析
   朴 浚鎔,高道 慎之介,David M. Chan,神藤 駿介,齋藤 佑樹,猿渡 洋

(75)重み付きAttentionのアライメント機構を用いた系列変換型声質変換
   山下 陽生,岡本 拓磨,高島 遼一,大谷 大和,滝口 哲也,戸田 智基,河井 恒

(76)身体で掴む間合い─インタラクティブメディアによる音楽合奏の間合い体得支援と効果検証
   黒瀧 かれん,三上 薫,竹川 佳成,松原 正樹

(77)日本語諸方言音声の韻律的特徴に着目した地域性分析のための大規模自己教師あり学習モデルの活用
   遠山 拓実,田中 孝祐,甲斐 充彦,中川 聖一

(78)日本語諸方言音声認識における大規模多言語事前学習モデルの比較と適応手法の検討
   高橋 尚希,淺川 夏生瑠,ナハル ラウフン,甲斐 充彦,中川 聖一

(79)Audio Spectrogram Transformerを用いた演奏家分類
   上治 正太郎,斎藤 博昭

(80)和音性の定量的評価モデルに基づく和音タイプ別認識特性の分析
   植村 あい子

(81)楽曲の全体構造を構築可能なマルチトラック音楽生成
   小原 勇輝,小林 哲則,小坂 直敏

(82)コミュニケーションロボットの交替潜時と動作が対話の円滑性に与える影響
   朱 凱,北村 達也,梅谷 智弘

(83)音響タギングとセマンティック地図に基づく大規模言語モデルを用いた大域的自己位置推定
   尾崎 晴美,坂東 宜昭,佐々木 洋子,大西 正輝

(84)オープンドメイン視聴覚データセットの構築と汎用視聴覚音響イベント物体検出への応用
   櫻井 舜,坂東 宜昭,井本 桂右,大西 正輝

(85)離散音声トークンを活用した歌声合成システムの開発に向けた音響モデルと特徴量の検討
   有田 諒子,中田 亘,山内 一輝,関 健太郎,楊 棟,齋藤 佑樹,猿渡 洋

(86)世界諸英語話者間の相互シャドーイングと話者・聴取者間の音声的差異に基づく聴取崩れの要因分析
   藤原 朱里,峯松 信明,中西 のりこ,齋藤 大輔

(87)最適輸送を用いた音素事後確率分布の比較と低リソース言語の発話比較への応用
   大佐 健人,孫 海童,峯松 信明,齋藤 大輔

(88)多様なシミュレーション音場における教師あり仮想マイクロホンアレイ信号推定の汎化性能評価
   服部 公宏,Huang Wen-Chin,武田 一哉,戸田 智基

(89)ステアリングベクトル推定に基づく自動焦点ニューラルビームフォーマの検討
   丸川 怜也,山田 武志

(90)JATTS: A Comparison-oriented Japanese Text-to-speech Open-sourced Toolkit
   Wen-Chin Huang,Lester Violeta,Tomoki Toda

(91)音声プライバシー保護のための敵対的サンプル生成と異なる話者埋め込み抽出器間における転移性評価
   中村 幸多郎,中鹿 亘

(92)SpREAD:日本語連続音声聴取時の繰り返し測定頭皮脳波データセット
   水野 友暁,櫻井 芳騎,吉村 奈津江,中鹿 亘

(93)人の可能性を解き放つ対話型診断AIエージェントの開発
   松山 洋一

一括ダウンロード