第159回音声言語情報処理研究発表会

プログラム詳細は以下をご参照ください。
https://www.ipsj.or.jp/kenkyukai/event/slp159.html

■オーラル SP/SLP1
(1) 日本語LLM型音声合成における日本語文字列の検討
   栗原 清

(2) HuBERTトークンによる韻律抑制効果を用いた日本語アクセント変換の試み
   水野 友暁,須田 仁志,中村 友彦,深山 覚,中鹿 亘

(3) 声道パラメータ表現および強化学習を利用したText-to-Action-to-Speech
   小野 晶子,加藤 徳啓,高道 慎之介

(4) 発話映像に基づく音声生成におけるTTS変換モデル及び音声合成モデルの比較評価
   脇坂 伸,張 海波,齊藤 剛史

■SIP
(5) 音楽想起時の神経活動ネットワークと内受容感覚の関係
   大塚 直樹,松永 華月,後藤 麻友,チャンポーンパックディー インオン,田中 聡久

(6) 音楽によるAwe体験の神経基盤:脳波パワーおよび接続性による検討
   後藤 麻友,岩下 素子,チャンポーンパックディー インオン,石川 牧子,石田 健二,田中 聡久

(7) Advanced Real-Time Anomaly Detection in Power Grid Networks State Estimation Using Graph Signal Processing Techniques
   Tukur Sada,Shogo Muramatsu

(8) Supervised Machine Learning Techniques for Fault Detection and Classification in Photovoltaic (PV) Systems
   Ahmed Malouq,Shogo Muramatsu

■SLP
(9) PolarBM:振幅と位相に相関を持つ複素スペクトル構造表現
   中鹿 亘,矢田部 浩平

(10)LogPolarBM:対数振幅を考慮した複素スペクトル構造表現
   中鹿 亘,矢田部 浩平

(11)湾曲複素正規分布とその振幅分布の理論的考察
   中鹿 亘,矢田部 浩平

■オーラル EA
(12)時間周波数マスクに基づくスイッチングビームフォーミングによる劣決定ブラインド音源分離
   中根 敦久,山岡 洸瑛,高宗 典玄,猿渡 洋,北村 大地,池下 林太郎,中谷 智広

(13)ステアリングベクトルの部分空間制約に基づく多チャンネル音源分離
   竹内 柚月,中嶋 大志,小野 順貴

(14)補助関数法に基づく分離フィルタとサンプリング周波数オフセットの同時最適化
   竹内 駿人,河村 隆生,小野 順貴,荒木 章子

■SLP
(15)Physics-informed Neural Networksの基礎と音声生成解析への応用
   横田 和哉

(16)対話相手のペルソナとその内部状態に応じた発話方策の自動獲得
   豊﨑 玲音,淡島 大晴,川北 晃太,篠﨑 隆宏

(17)Full-duplex音声対話モデルにおける性別表現のプロービング
   八木 颯斗,稲垣 賢斗,高島 悠樹,安藤 厚志,高道 慎之介

(18)Altered auditory feedbackに基づく感情誘導における音声特徴量弁別閾の調査
   中村 颯,福田 航希,高道 慎之介,大畑 龍

(19)多ジャンルのスポーツ音声実況における音声特徴量の時間的構造の調査
   松下 嶺佑,高道 慎之介,齋藤 佑樹,ニュービッグ グラム,須藤 克仁,高村 大也,石垣 達也

■EA
(20)2チャンネル間群遅延の信頼性に基づく音源定位
   波多野 舜,陶山 健仁

(21)複数の指向性回路に基づく2マイクロホン信号抽出方法
   五井野 珠琉,陶山 健仁

(22)単一音源ビンの抽出に着目した2マイクロホン複数音源定位
   嘉本 梨玖,陶山 健仁

(23)聴感モデルの効率的な学習のためのk-medoidsを用いたサンプリング戦略の検討残響時間の予測における有効性の評価
   古閑 匠,植野 夏樹,石塚 健治,中村 章人,高橋 祐

(24)尺八のCT画像の輝度値に基づく3Dモデルの内径補正と付加製造による復元評価
   中尾 美月,須藤 壮一朗,水野 明哲,高橋 義典

(25)振動デバイスが音楽聴取の主観印象に与える影響
   小原 孝之,中川原 光洋,水町 光徳

(26)風船破裂における音響放射ダイナミクスの実験的解明:高速度映像と高時間分解能音響計測の同期解析
   室賀 早登,草野 翼,大久保 寛

(27)音響印象予測モデルに基づく環境音の印象分布分析とText-to-Audioモデルの印象制御の検討
   西島 大史,齋藤 大輔,峯松 信明

(28)個別楽器音に着目した楽曲間類似度表現学習におけるテキスト表現による楽器指定
   今村 剛大,橋爪 優果,ホワン ウェンチン,戸田 智基

(29)MLPを用いた学習データ選別による音楽音源分離のためのデータ拡張手法
   平原 裕雅,片岡 章俊

(30)分散高速多チャネル非負値行列因子分解による分散マイクロホンアレイを用いたブラインド音源分離
   錦織 広尚,伊藤 信貴,山岡 洸瑛,高宗 典玄,猿渡 洋

(31)繰り返しパルス音刺激における聴覚応答特性の比較~骨伝導呈示とマイクロ波聴覚効果の実験的検証に向けて~
   ハディ 平和,大久保 寛,草野 翼,寺尾 安生,多氣 昌生,鈴木 敬久,岸岡 翔馬,岡本 真由美,湯浅 薫

■オーラル EA
(32)代理集合分類に基づく深層学習による並列および非並列データを活用したモノラル音声強調
   小川 諒,伊藤 信貴,高宗 典玄,山岡 洸瑛,猿渡 洋

(33)言語クエリに基づく多チャンネル音源分離の移動音源に対する適用
   中村 優希,中嶋 大志,小野 順貴

(34)既存データセットとの意図しない重複を避ける環境音評価データセットの半自動構築法
   岸 秀,高道 慎之介,滝沢 力,金森 勇介,砺波 紀之,永瀬 亮太郎,井本 桂右,岡本 悠希

■SLP
(35)劣環境下におけるDeepfake音声検出のためのドメイン適応
   堤 歩斗,後藤 晃,斉藤 裕子,松浦 廣樹,塩田 さやか

(36)遅延制御型選択的状態空間を用いたデュアルモード音声認識
   森谷 崇史,三村 正人,松井 清彰,佐藤 宏,松浦 孝平

(37)音トークンのクロスドメイン変動分析:音声・音楽・環境音間の比較
   芦原 孝典,デルクロア マーク,落合 翼,松浦 孝平,堀口 翔太

(38)話者埋め込みの補間に基づく複数話者テキスト音声合成
   大本 隼也,西村 良太,松本 和幸

(39)臨床対話音声から生成した経過記録の電子カルテへの入力インタフェース
   斉藤 翼,山中 稜斗,若林 佑幸,北岡 教英

(40)藤崎モデルに基づく基本周波数制御を用いた強調箇所指定可能な日本語音声合成モデル
   渡部 達貴,若林 佑幸,太田 健吾,西村 良太,ハン ボムソク,鷲崎 海,北岡 教英

(41)認知症診断における雑談を対象とした言語的統計量と事前学習モデル由来の音声・言語特徴を用いた認知症判別
   田村 駿弥,内山 慎太郎,若林 佑幸,西村 良太,北岡 教英

(42)SMASHコーパスDLC:対戦ゲーム動画に対する掛け合い実況解説音声コーパス
   齋藤 佑樹,川松 亮太,高道 慎之介,ニュービッグ グラム,須藤 克仁,猿渡 洋,高村 大也,石垣 達也

(43)音声コーパスへの絵文字アノテーションとそれを活用した感情音声合成手法の検討
   川松 亮太,濱田 誉輝,山内 一輝,齋藤 佑樹,猿渡 洋

(44)Self Voice Conversion as an Attack against Neural Audio Watermarking
   Yigitcan 〓zer,Wanying Ge,Zhe Zhang,Xin Wang,Junichi Yamagishi

(45)ニューラルコーデック言語モデルに基づく音声プロンプトを利用したzero-shot声質変換
   恩田 将人,橋本 佳,南角 吉彦,徳田 恵一

(46)評価情報を付与した音声・声質説明文ペアデータを用いた自然言語声質制御音声合成の検討
   田牧 宏都,橋本 佳,南角 吉彦,徳田 恵一

(47)プロンプト音声合成を用いた漫画音声合成
   越野 颯太,上治 正太郎,高道 慎之介,中村 友彦

(48)音声言語基盤モデルを用いた音声好感度推定において声質表現文生成を経由する効果
   加藤 徳啓,小野 晶子,高道 慎之介,土橋 宜典

■EA2/SIP
(49)騒音環境下における音質劣化の知覚と省電力音源再生の検討
   迫田 悠良,戸川 颯一朗,中川原 光洋,水町 光徳

(50)室内インパルス応答と機械学習を用いた単一マイクロフォンによる音源定位
   前澤 祐人,土屋 隆生

(51)Moving-CLAP:移動音源に対応した音響言語モデルの提案
   早崎 勇輝,関 健太郎,岡本 悠希,山岡 洸瑛,齋藤 佑樹,猿渡 洋

(52)特定方向音声強調のための指向特性正則化付き高速多チャネル非負値行列因子分解
   小野 稜介,Aditya Arie Nugraha,坂東 宜昭,吉井 和佳

(53)疎な頭部インパルス応答のデータセットから密な頭部インパルス応答のデータセットの生成に関する検討
   大志田 翼,西口 正之,渡邉 貫治,安倍 幸治

(54)GNNを用いた1ch音源強調モデルの検討
   森川 泰輔,片岡 章俊

(55)暗号化領域における敵対的摂動を用いた改ざん画像の検出法
   オリモブ ムハマドオリム,堀尾 虹輝,塩田 さやか,貴家 仁志

(56)短時間フーリエ位相復元におけるタイト窓の有効性の検証
   忍田 篤彦,髙橋 奎人,北原 大地

(57)累積分布関数を利用した雑音下のスプライン関数節点配置
   田辺 流萌,荒井 浩貴,北原 大地

(58)衛星全球降水マップの低遅延雨量計補正アルゴリズムの日本域での検証
   小泉 淳,広瀬 民志,牛尾 知雄,北原 大地

(59)凸最適化による気象レーダネットワークからの雨量マップ作成
   渡部 桜史朗,江頭 彬,内藤 伸治,北原 大地

(60)動的計画法に基づく精度保証付量子化器設計に関する検討
   坂東 幸浩

■SIP
(61)手触り感における価値表現のための官能評価データ分析手法の提案
   田中 美穂,小椋 清孝,横川 智教,有本 和民,高尾 英邦

(62)PHISWIDv2: より現実的な物理モデルに基づく合成水中画像データセット
   金子 玲菜,原 惇也,東 広志,田中 雄一

(63)脳波に基づく両耳同音環境での聴覚的注意デコーディング
   吉野 将裕,横田 陽樹,原 惇也,田中 雄一,東 広志

(64)頭蓋内脳波を用いた発話単語推定における判別可能性の時間推移と予測寄与解析
   竹井 達哉,古明地 秀治,村上 翔哉,渡部 ゆう,三橋 匠,飯村 康司,鈴木 皓晴,菅野 秀宣,篠田 浩一,田中 聡久

■SP/SLP
(65)難聴者の音楽体験の質向上に向けたWhisper複数認識候補に基づく歌詞了解度予測
   近藤 祐斗,亀岡 弘和,田中 宏,金子 卓弘

(66)不正収録音声から合成されたディープフェイク音声によるなりすまし攻撃
   古林 嵯羽仁,高道 慎之介,塩田 さやか

(67)J-SPAW2: 録音再生攻撃によるなりすまし音声の収録環境を分析可能な日本語音声コーパス
   堀江 涼花,高道 慎之介,塩田 さやか

(68)歌声の自然性MOS値に重要な音響統計量の保持能力に基づく事前学習モデルの適合性分析
   有田 諒子,齋藤 佑樹,猿渡 洋

(69)話者性に関する対照表現学習を用いた未知話者声質変換
   金子 大悟,中鹿 亘

(70)対照事前学習に基づく音響エンコーダを用いた声質変換
   佐藤 暖隼,中鹿 亘

(71)大規模学習条件下および雑音環境下におけるVAE-SiFiGANの性能評価
   荻田 健一,米山 怜於,ホワン ウェンチン,戸田 智基

(72)学習済みノイズ生成器を用いた話者認識に対する敵対的音声の高速生成法
   中村 幸多郎,中鹿 亘

(73)音声認識におけるコンテキスト依存度の提案とMambaの有効性分析
   佐藤 丈一郎,樋口 陽祐,小林 哲則,小川 哲司

(74)局所・大域的注視に基づく発話重畳区間の中間表現補正を用いた複数話者音声認識
   小島 啓吾,樋口 陽祐,小林 哲則,小川 哲司

■APSIPA JC
(75)OpenEXR画像に対する可逆色調制御
   山口 晏菜,今泉 祥子

(76)環境音と説明文の意味的関連性に関する主観評価データセットの分析
   金森 勇介,岡本 悠希,高道 慎之介,齋藤 佑樹,猿渡 洋

(77)複数話者音声認識に向けた話者識別型CTCモデルの検討
   佐久間 旭,佐藤 裕明,菅野 竜雅,熊野 正,河合 吉彦,渡部 晋治

(78)映像解析によるヒト頭部回旋運動のサブムーブメント抽出
   森園 涼斗,渡邊 さつき,原 惇也,東 広志,田中 雄一

(79)Exploring Speech-driven Facial Motion Modeling via Flow-based Generative Frameworks
   Jinsheng Chen,Joonyong Park,Hironori Doi,Byeongseon Park,Yuma Shirahata,Kentaro Tachibana,Dong Yang,Yuki Saito,Hiroshi Saruwatari

(80)DC最適化を用いた一般化グラフ信号のサンプリング作用素の設計
   山下 慶太郎,小野 峻佑

(81)雑音・無音ラベリングとCTC規範柔軟化による雑音下での音声区間検出不要なリアルタイム音声認識
   坂井 利光,若林 佑幸,西村 良太,北岡 教英

(82)直交畳み込み層の初期化に関する検討
   内田 蓮,矢田部 浩平,中村 友彦

■SIP
(83)可聴音の位相干渉に基づく対象物までの音響測距法-原理から現在までの進展状況-
   中迫 昇,上保 徹志,篠原 寿広,中山 雅人

■APSIPA / IEEE SPS
(84)Tensor tracking and applications
   Nguyen Linh Trung

■EA3
(85)オノマトペ画像を用いた音検索のためのクロスモーダル表現学習
   小島 大和,井本 桂右,土屋 隆生

(86)深層単語ユニグラムに基づく半教師あり音響シーン分類
   古賀 直樹,坂東 宜昭,井本 桂右,土屋 隆生

(87)空間音とテキストの対照学習による音源情報と空間情報の分離表現学習
   上治 正太郎,高道 慎之介,山岡 洸瑛

(88)吹奏楽コンクール録音の賞別比較におけるMERT特徴量の適用と性能評価
   平岩 樺生,深山 覚

■SP/SLP
(89)ニューラルオーディオコーデックにおける雑音頑健性分析~Zipf則・Heaps則に基づく言語統計構造と劣化音声の関係~
   朴 浚鎔,高道 慎之介,DavidM. Chan,神藤 駿介,齋藤 佑樹,猿渡 洋

(90)Transformer型音声認識器におけるエンコーダ先読み情報を活用したデコーディング手法の検討
   岡田 翔太,齋藤 大輔,峯松 信明

(91)偽陽性と偽陰性を可視化する双方向差分特徴量を用いた多重音音高推定
   石川 峻弥,中塚 貴之,渡邉 研斗,Tian Cheng,中野 倫靖,後藤 真孝,中鹿 亘

(92)話者認証に対する敵対的攻撃における入力音源特性の影響に関する分析
   川原 大樹,宮本 蓮,齋藤 大輔,峯松 信明

(93)Lipschitz連続な時間周波数マスキング型DNNのLipschitz定数の評価
   松本 和樹,内田 蓮,矢田部 浩平

(94)S2T2Sを用いた発話明瞭度改善
   大内 永怜,杉浦 陽介,島村 徹也

(95)音声対話における音源分離及びターンテイキング予測の同時最適化
   溝渕 悠朔,井上 昂治,井本 桂右,吉井 和佳,河原 達也

(96)NeuWORLD: 周期性・非周期性・フィルタに基づくニューラル信号処理ボコーダ
   芦田 裕飛,中鹿 亘

(97)大規模音声基盤モデルの適応学習に向けた異種の大規模コーパスの書き起こし整合化
   塩澤 凜於,甲斐 充彦,中川 聖一

■SIP3
(98)Robust Koopman Operator Estimation Against Impulsive Noise Using Adaptive Projected Subgradient Method
   Haru Honda,Masahiro Yukawa

(99)微分方程式の時間周波数領域解法
   安藤 繁

(100)A Design of Monotone Lipschitz Gradient Denoiser Using Diffusion Model: Towards Explainable Plug-and-Play Method for Image Restoration
   Riki Suzuki,Masahiro Yukawa

(101)Hypergradient Descentに基づく圧縮センシングアルゴリズムのハイパーパラメータ自動最適化
   中根 悠輔,中井 彩乃,和田 山正

■EA3
(102)ブラインド音源分離を悪用した盗聴に対する音響ジャミングの検討
   中嶋 大志,小野 順貴

(103)サンプリング周波数非依存畳み込み層を用いたトークン時間解像度可変ニューラルオーディオコーデックの検討
   中村 友彦,中田 亘,今村 奏海,齋藤 佑樹

(104)分散マイクロホンアレイにおける非集中型独立低ランク行列分析
   春山 優太,山岡 洸瑛,高宗 典玄,猿渡 洋

(105)時間周波数制御付き辞書学習によるNMFベース多成分ドラム分離手法の高精度化
   前嶋 祐里,吉野 夏樹,田中 章

(106)チャネル相関除去を導入したオンライン二次経路モデリングを用いたマルチチャネルANCシステムに関する検討
   辻脇 楓馬,豊岡 祥太,梶川 嘉延

(107)バランスドアーマチュア型電気音響変換器における等価回路パラメータ推定に関する検討
   梅宮 悠輔,豊岡 祥太,喜多 俊輔,梶川 嘉延

(108)小型音響吸引ピンセットのモバイル化に向けたバッテリー駆動式設計と実装
   米田 翔哉,横山 裕正,草野 翼,大久保 寛

(109)携帯型パラメトリックスピーカにおけるDAIF法に基づいたクロストークキャンセルに関する検討
   谷ノ口 陽向,豊岡 祥太,岩居 健太,梶川 嘉延

(110)最適化技術を用いたパラメトリックスピーカにおけるサイドローブの抑制に関する検討
   中川 竜,豊岡 祥太,岩居 健太,梶川 嘉延

(111)音響振動連成解析を用いたシェル構造型分布モードスピーカの振動板形状と指向性特性の相関評価
   木村 唯斗,草野 翼,大久保 寛

(112)指向性マイクロホンを用いたマルチチャネルデュアルANCシステムに関する検討
   仙藤 拓馬,豊岡 祥太,岩居 健太,梶川 嘉延

(113)空間事前情報を用いた音源分離のためのベイズ高速多チャネル非負値行列因子分解
   市葉 拓馬,Aditya Arie Nugraha,Mathieu Fontaine,Diego Di Carlo,坂東 宜昭,河原 達也,吉井 和佳

■EA
(114)自然言語によって表現可能な概念とのマッピングにより、時系列データを理解するAI
   土肥 宏太

■SLP
(115)共有IPAエキスパートを持つswitch Conformerによる多言語音声認識
   三村 正人,Lee Jaeyoung,河原 達也

(116)日本の消滅危機言語への事前学習済みASRモデルの適用:沖縄語首里方言とアイヌ語沙流方言を事例として
   松浦 孝平,芦原 孝典,河原 達也

(117)階層的補助損失によるAligner-encoderの正則化
   Lee Jaeyoung,三村 正人

(118)Cross-Attribute Fairness Inference in Speech Emotion Recognition via Task Arithmetic
   Woan-Shiuan Chien,Tomohiko Nakamura,Huan-Yu Chen,Satoru Fukayama,Hitoshi Suda,Jun Ogata,Chi-Chun Lee

(119)テキスト独立話者照合システムの言語依存性~コントロールされた条件下での評価~
   中村 倫子,後藤 晃,斉藤 裕子,松浦 廣樹,越仲 孝文

■SIP
(120)河川一体制御のためのグラフ上データ同化による水位分布予測
   相馬 蒔,金内 尋夢,伊藤 隆人,安田 浩保,永原 正章,村松 正吾

(121)補助関数法に基づく相互相関関数最大化による相似変換画像の位置合わせ
   山下 真司,木下 裕磨,貴家 仁志

(122)定常視覚刺激誘発BCIのためのランダムサンプリングによる信号強調
   鷲沢 嘉一

(123)スペクトル分解の実装に依存しない一意なグラフフーリエ変換の構成
   宮澤 拓弥,吉野 夏樹,田中 章

(124)ARivE: 河川水位一体把握・制御に向けた水位分布予測アプリケーション
   伊藤 隆人,金内 尋夢,安田 浩保,永原 正章,村松 正吾

(125)ユーザ非依存条件下での脳波感情認識のためのドメイン適応型オンライン学習
   森 航太郎,鷲沢 嘉一

(126)脳波を用いた音響包絡追従解析に基づく言語音声に対する注意集中力の評価
   市川 佳直,鷲沢 嘉一

(127)超指向性音源とパルス圧縮技術を用いた不可視領域音響イメージングの高精度化に関する検討
   小松 来夢,草野 翼,大久保 寛

(128)ニューラルネットワーク重みの量子化+低ランク分解のための実行可能性問題とDouglas-Rachford分割法
   鈴木 陽人,山岸 昌夫

(129)ニューラルネットワーク重みの三値量子化のための比較演算回数削減手法
   後藤 優斗,山岸 昌夫

(130)サブミリ厚試料のナノイメージングに向けた位相回復アルゴリズムの拡張
   赤石 夏輝,矢田部 浩平,高山 裕貴

一括ダウンロード