第159回音声言語情報処理研究発表会

プログラム詳細は以下をご参照ください。
https://www.ipsj.or.jp/kenkyukai/event/slp159.html

■オーラル SP/SLP1
（1）日本語LLM型音声合成における日本語文字列の検討
　　　栗原清

（2） HuBERTトークンによる韻律抑制効果を用いた日本語アクセント変換の試み
　　　水野友暁，須田仁志，中村友彦，深山覚，中鹿亘

（3）声道パラメータ表現および強化学習を利用したText-to-Action-to-Speech
　　　小野晶子，加藤徳啓，高道慎之介

（4）発話映像に基づく音声生成におけるTTS変換モデル及び音声合成モデルの比較評価
　　　脇坂伸，張海波，齊藤剛史

■SIP
（5）音楽想起時の神経活動ネットワークと内受容感覚の関係
　　　大塚直樹，松永華月，後藤麻友，チャンポーンパックディーインオン，田中聡久

（6）音楽によるAwe体験の神経基盤：脳波パワーおよび接続性による検討
　　　後藤麻友，岩下素子，チャンポーンパックディーインオン，石川牧子，石田健二，田中聡久

（7） Advanced Real-Time Anomaly Detection in Power Grid Networks State Estimation Using Graph Signal Processing Techniques
　　　Tukur Sada，Shogo Muramatsu

（8） Supervised Machine Learning Techniques for Fault Detection and Classification in Photovoltaic (PV) Systems
　　　Ahmed Malouq，Shogo Muramatsu

■SLP
（9） PolarBM：振幅と位相に相関を持つ複素スペクトル構造表現
　　　中鹿亘，矢田部浩平

（10）LogPolarBM：対数振幅を考慮した複素スペクトル構造表現
　　　中鹿亘，矢田部浩平

（11）湾曲複素正規分布とその振幅分布の理論的考察
　　　中鹿亘，矢田部浩平

■オーラル EA
（12）時間周波数マスクに基づくスイッチングビームフォーミングによる劣決定ブラインド音源分離
　　　中根敦久，山岡洸瑛，高宗典玄，猿渡洋，北村大地，池下林太郎，中谷智広

（13）ステアリングベクトルの部分空間制約に基づく多チャンネル音源分離
　　　竹内柚月，中嶋大志，小野順貴

（14）補助関数法に基づく分離フィルタとサンプリング周波数オフセットの同時最適化
　　　竹内駿人，河村隆生，小野順貴，荒木章子

■SLP
（15）Physics-informed Neural Networksの基礎と音声生成解析への応用
　　　横田和哉

（16）対話相手のペルソナとその内部状態に応じた発話方策の自動獲得
　　　豊﨑玲音，淡島大晴，川北晃太，篠﨑隆宏

（17）Full-duplex音声対話モデルにおける性別表現のプロービング
　　　八木颯斗，稲垣賢斗，高島悠樹，安藤厚志，高道慎之介

（18）Altered auditory feedbackに基づく感情誘導における音声特徴量弁別閾の調査
　　　中村颯，福田航希，高道慎之介，大畑龍

（19）多ジャンルのスポーツ音声実況における音声特徴量の時間的構造の調査
　　　松下嶺佑，高道慎之介，齋藤佑樹，ニュービッググラム，須藤克仁，高村大也，石垣達也

■EA
（20）2チャンネル間群遅延の信頼性に基づく音源定位
　　　波多野舜，陶山健仁

（21）複数の指向性回路に基づく2マイクロホン信号抽出方法
　　　五井野珠琉，陶山健仁

（22）単一音源ビンの抽出に着目した2マイクロホン複数音源定位
　　　嘉本梨玖，陶山健仁

（23）聴感モデルの効率的な学習のためのk-medoidsを用いたサンプリング戦略の検討残響時間の予測における有効性の評価
　　　古閑匠，植野夏樹，石塚健治，中村章人，高橋祐

（24）尺八のCT画像の輝度値に基づく3Dモデルの内径補正と付加製造による復元評価
　　　中尾美月，須藤壮一朗，水野明哲，高橋義典

（25）振動デバイスが音楽聴取の主観印象に与える影響
　　　小原孝之，中川原光洋，水町光徳

（26）風船破裂における音響放射ダイナミクスの実験的解明：高速度映像と高時間分解能音響計測の同期解析
　　　室賀早登，草野翼，大久保寛

（27）音響印象予測モデルに基づく環境音の印象分布分析とText-to-Audioモデルの印象制御の検討
　　　西島大史，齋藤大輔，峯松信明

（28）個別楽器音に着目した楽曲間類似度表現学習におけるテキスト表現による楽器指定
　　　今村剛大，橋爪優果，ホワンウェンチン，戸田智基

（29）MLPを用いた学習データ選別による音楽音源分離のためのデータ拡張手法
　　　平原裕雅，片岡章俊

（30）分散高速多チャネル非負値行列因子分解による分散マイクロホンアレイを用いたブラインド音源分離
　　　錦織広尚，伊藤信貴，山岡洸瑛，高宗典玄，猿渡洋

（31）繰り返しパルス音刺激における聴覚応答特性の比較～骨伝導呈示とマイクロ波聴覚効果の実験的検証に向けて～
　　　ハディ平和，大久保寛，草野翼，寺尾安生，多氣昌生，鈴木敬久，岸岡翔馬，岡本真由美，湯浅薫

■オーラル EA
（32）代理集合分類に基づく深層学習による並列および非並列データを活用したモノラル音声強調
　　　小川諒，伊藤信貴，高宗典玄，山岡洸瑛，猿渡洋

（33）言語クエリに基づく多チャンネル音源分離の移動音源に対する適用
　　　中村優希，中嶋大志，小野順貴

（34）既存データセットとの意図しない重複を避ける環境音評価データセットの半自動構築法
　　　岸秀，高道慎之介，滝沢力，金森勇介，砺波紀之，永瀬亮太郎，井本桂右，岡本悠希

■SLP
（35）劣環境下におけるDeepfake音声検出のためのドメイン適応
　　　堤歩斗，後藤晃，斉藤裕子，松浦廣樹，塩田さやか

（36）遅延制御型選択的状態空間を用いたデュアルモード音声認識
　　　森谷崇史，三村正人，松井清彰，佐藤宏，松浦孝平

（37）音トークンのクロスドメイン変動分析：音声・音楽・環境音間の比較
　　　芦原孝典，デルクロアマーク，落合翼，松浦孝平，堀口翔太

（38）話者埋め込みの補間に基づく複数話者テキスト音声合成
　　　大本隼也，西村良太，松本和幸

（39）臨床対話音声から生成した経過記録の電子カルテへの入力インタフェース
　　　斉藤翼，山中稜斗，若林佑幸，北岡教英

（40）藤崎モデルに基づく基本周波数制御を用いた強調箇所指定可能な日本語音声合成モデル
　　　渡部達貴，若林佑幸，太田健吾，西村良太，ハンボムソク，鷲崎海，北岡教英

（41）認知症診断における雑談を対象とした言語的統計量と事前学習モデル由来の音声・言語特徴を用いた認知症判別
　　　田村駿弥，内山慎太郎，若林佑幸，西村良太，北岡教英

（42）SMASHコーパスDLC：対戦ゲーム動画に対する掛け合い実況解説音声コーパス
　　　齋藤佑樹，川松亮太，高道慎之介，ニュービッググラム，須藤克仁，猿渡洋，高村大也，石垣達也

（43）音声コーパスへの絵文字アノテーションとそれを活用した感情音声合成手法の検討
　　　川松亮太，濱田誉輝，山内一輝，齋藤佑樹，猿渡洋

（44）Self Voice Conversion as an Attack against Neural Audio Watermarking
　　　Yigitcan 〓zer，Wanying Ge，Zhe Zhang，Xin Wang，Junichi Yamagishi

（45）ニューラルコーデック言語モデルに基づく音声プロンプトを利用したzero-shot声質変換
　　　恩田将人，橋本佳，南角吉彦，徳田恵一

（46）評価情報を付与した音声・声質説明文ペアデータを用いた自然言語声質制御音声合成の検討
　　　田牧宏都，橋本佳，南角吉彦，徳田恵一

（47）プロンプト音声合成を用いた漫画音声合成
　　　越野颯太，上治正太郎，高道慎之介，中村友彦

（48）音声言語基盤モデルを用いた音声好感度推定において声質表現文生成を経由する効果
　　　加藤徳啓，小野晶子，高道慎之介，土橋宜典

■EA2/SIP
（49）騒音環境下における音質劣化の知覚と省電力音源再生の検討
　　　迫田悠良，戸川颯一朗，中川原光洋，水町光徳

（50）室内インパルス応答と機械学習を用いた単一マイクロフォンによる音源定位
　　　前澤祐人，土屋隆生

（51）Moving-CLAP：移動音源に対応した音響言語モデルの提案
　　　早崎勇輝，関健太郎，岡本悠希，山岡洸瑛，齋藤佑樹，猿渡洋

（52）特定方向音声強調のための指向特性正則化付き高速多チャネル非負値行列因子分解
　　　小野稜介，Aditya Arie Nugraha，坂東宜昭，吉井和佳

（53）疎な頭部インパルス応答のデータセットから密な頭部インパルス応答のデータセットの生成に関する検討
　　　大志田翼，西口正之，渡邉貫治，安倍幸治

（54）GNNを用いた1ch音源強調モデルの検討
　　　森川泰輔，片岡章俊

（55）暗号化領域における敵対的摂動を用いた改ざん画像の検出法
　　　オリモブムハマドオリム，堀尾虹輝，塩田さやか，貴家仁志

（56）短時間フーリエ位相復元におけるタイト窓の有効性の検証
　　　忍田篤彦，髙橋奎人，北原大地

（57）累積分布関数を利用した雑音下のスプライン関数節点配置
　　　田辺流萌，荒井浩貴，北原大地

（58）衛星全球降水マップの低遅延雨量計補正アルゴリズムの日本域での検証
　　　小泉淳，広瀬民志，牛尾知雄，北原大地

（59）凸最適化による気象レーダネットワークからの雨量マップ作成
　　　渡部桜史朗，江頭彬，内藤伸治，北原大地

（60）動的計画法に基づく精度保証付量子化器設計に関する検討
　　　坂東幸浩

■SIP
（61）手触り感における価値表現のための官能評価データ分析手法の提案
　　　田中美穂，小椋清孝，横川智教，有本和民，高尾英邦

（62）PHISWIDv2: より現実的な物理モデルに基づく合成水中画像データセット
　　　金子玲菜，原惇也，東広志，田中雄一

（63）脳波に基づく両耳同音環境での聴覚的注意デコーディング
　　　吉野将裕，横田陽樹，原惇也，田中雄一，東広志

（64）頭蓋内脳波を用いた発話単語推定における判別可能性の時間推移と予測寄与解析
　　　竹井達哉，古明地秀治，村上翔哉，渡部ゆう，三橋匠，飯村康司，鈴木皓晴，菅野秀宣，篠田浩一，田中聡久

■SP/SLP
（65）難聴者の音楽体験の質向上に向けたWhisper複数認識候補に基づく歌詞了解度予測
　　　近藤祐斗，亀岡弘和，田中宏，金子卓弘

（66）不正収録音声から合成されたディープフェイク音声によるなりすまし攻撃
　　　古林嵯羽仁，高道慎之介，塩田さやか

（67）J-SPAW2: 録音再生攻撃によるなりすまし音声の収録環境を分析可能な日本語音声コーパス
　　　堀江涼花，高道慎之介，塩田さやか

（68）歌声の自然性MOS値に重要な音響統計量の保持能力に基づく事前学習モデルの適合性分析
　　　有田諒子，齋藤佑樹，猿渡洋

（69）話者性に関する対照表現学習を用いた未知話者声質変換
　　　金子大悟，中鹿亘

（70）対照事前学習に基づく音響エンコーダを用いた声質変換
　　　佐藤暖隼，中鹿亘

（71）大規模学習条件下および雑音環境下におけるVAE-SiFiGANの性能評価
　　　荻田健一，米山怜於，ホワンウェンチン，戸田智基

（72）学習済みノイズ生成器を用いた話者認識に対する敵対的音声の高速生成法
　　　中村幸多郎，中鹿亘

（73）音声認識におけるコンテキスト依存度の提案とMambaの有効性分析
　　　佐藤丈一郎，樋口陽祐，小林哲則，小川哲司

（74）局所・大域的注視に基づく発話重畳区間の中間表現補正を用いた複数話者音声認識
　　　小島啓吾，樋口陽祐，小林哲則，小川哲司

■APSIPA JC
（75）OpenEXR画像に対する可逆色調制御
　　　山口晏菜，今泉祥子

（76）環境音と説明文の意味的関連性に関する主観評価データセットの分析
　　　金森勇介，岡本悠希，高道慎之介，齋藤佑樹，猿渡洋

（77）複数話者音声認識に向けた話者識別型CTCモデルの検討
　　　佐久間旭，佐藤裕明，菅野竜雅，熊野正，河合吉彦，渡部晋治

（78）映像解析によるヒト頭部回旋運動のサブムーブメント抽出
　　　森園涼斗，渡邊さつき，原惇也，東広志，田中雄一

（79）Exploring Speech-driven Facial Motion Modeling via Flow-based Generative Frameworks
　　　Jinsheng Chen，Joonyong Park，Hironori Doi，Byeongseon Park，Yuma Shirahata，Kentaro Tachibana，Dong Yang，Yuki Saito，Hiroshi Saruwatari

（80）DC最適化を用いた一般化グラフ信号のサンプリング作用素の設計
　　　山下慶太郎，小野峻佑

（81）雑音・無音ラベリングとCTC規範柔軟化による雑音下での音声区間検出不要なリアルタイム音声認識
　　　坂井利光，若林佑幸，西村良太，北岡教英

（82）直交畳み込み層の初期化に関する検討
　　　内田蓮，矢田部浩平，中村友彦

■SIP
（83）可聴音の位相干渉に基づく対象物までの音響測距法-原理から現在までの進展状況-
　　　中迫昇，上保徹志，篠原寿広，中山雅人

■APSIPA / IEEE SPS
（84）Tensor tracking and applications
　　　Nguyen Linh Trung

■EA3
（85）オノマトペ画像を用いた音検索のためのクロスモーダル表現学習
　　　小島大和，井本桂右，土屋隆生

（86）深層単語ユニグラムに基づく半教師あり音響シーン分類
　　　古賀直樹，坂東宜昭，井本桂右，土屋隆生

（87）空間音とテキストの対照学習による音源情報と空間情報の分離表現学習
　　　上治正太郎，高道慎之介，山岡洸瑛

（88）吹奏楽コンクール録音の賞別比較におけるMERT特徴量の適用と性能評価
　　　平岩樺生，深山覚

■SP/SLP
（89）ニューラルオーディオコーデックにおける雑音頑健性分析～Zipf則・Heaps則に基づく言語統計構造と劣化音声の関係～
　　　朴浚鎔，高道慎之介，DavidM. Chan，神藤駿介，齋藤佑樹，猿渡洋

（90）Transformer型音声認識器におけるエンコーダ先読み情報を活用したデコーディング手法の検討
　　　岡田翔太，齋藤大輔，峯松信明

（91）偽陽性と偽陰性を可視化する双方向差分特徴量を用いた多重音音高推定
　　　石川峻弥，中塚貴之，渡邉研斗，Tian Cheng，中野倫靖，後藤真孝，中鹿亘

（92）話者認証に対する敵対的攻撃における入力音源特性の影響に関する分析
　　　川原大樹，宮本蓮，齋藤大輔，峯松信明

（93）Lipschitz連続な時間周波数マスキング型DNNのLipschitz定数の評価
　　　松本和樹，内田蓮，矢田部浩平

（94）S2T2Sを用いた発話明瞭度改善
　　　大内永怜，杉浦陽介，島村徹也

（95）音声対話における音源分離及びターンテイキング予測の同時最適化
　　　溝渕悠朔，井上昂治，井本桂右，吉井和佳，河原達也

（96）NeuWORLD: 周期性・非周期性・フィルタに基づくニューラル信号処理ボコーダ
　　　芦田裕飛，中鹿亘

（97）大規模音声基盤モデルの適応学習に向けた異種の大規模コーパスの書き起こし整合化
　　　塩澤凜於，甲斐充彦，中川聖一

■SIP3
（98）Robust Koopman Operator Estimation Against Impulsive Noise Using Adaptive Projected Subgradient Method
　　　Haru Honda，Masahiro Yukawa

（99）微分方程式の時間周波数領域解法
　　　安藤繁

（100）A Design of Monotone Lipschitz Gradient Denoiser Using Diffusion Model: Towards Explainable Plug-and-Play Method for Image Restoration
　　　Riki Suzuki，Masahiro Yukawa

（101）Hypergradient Descentに基づく圧縮センシングアルゴリズムのハイパーパラメータ自動最適化
　　　中根悠輔，中井彩乃，和田山正

■EA3
（102）ブラインド音源分離を悪用した盗聴に対する音響ジャミングの検討
　　　中嶋大志，小野順貴

（103）サンプリング周波数非依存畳み込み層を用いたトークン時間解像度可変ニューラルオーディオコーデックの検討
　　　中村友彦，中田亘，今村奏海，齋藤佑樹

（104）分散マイクロホンアレイにおける非集中型独立低ランク行列分析
　　　春山優太，山岡洸瑛，高宗典玄，猿渡洋

（105）時間周波数制御付き辞書学習によるNMFベース多成分ドラム分離手法の高精度化
　　　前嶋祐里，吉野夏樹，田中章

（106）チャネル相関除去を導入したオンライン二次経路モデリングを用いたマルチチャネルANCシステムに関する検討
　　　辻脇楓馬，豊岡祥太，梶川嘉延

（107）バランスドアーマチュア型電気音響変換器における等価回路パラメータ推定に関する検討
　　　梅宮悠輔，豊岡祥太，喜多俊輔，梶川嘉延

（108）小型音響吸引ピンセットのモバイル化に向けたバッテリー駆動式設計と実装
　　　米田翔哉，横山裕正，草野翼，大久保寛

（109）携帯型パラメトリックスピーカにおけるDAIF法に基づいたクロストークキャンセルに関する検討
　　　谷ノ口陽向，豊岡祥太，岩居健太，梶川嘉延

（110）最適化技術を用いたパラメトリックスピーカにおけるサイドローブの抑制に関する検討
　　　中川竜，豊岡祥太，岩居健太，梶川嘉延

（111）音響振動連成解析を用いたシェル構造型分布モードスピーカの振動板形状と指向性特性の相関評価
　　　木村唯斗，草野翼，大久保寛

（112）指向性マイクロホンを用いたマルチチャネルデュアルANCシステムに関する検討
　　　仙藤拓馬，豊岡祥太，岩居健太，梶川嘉延

（113）空間事前情報を用いた音源分離のためのベイズ高速多チャネル非負値行列因子分解
　　　市葉拓馬，Aditya Arie Nugraha，Mathieu Fontaine，Diego Di Carlo，坂東宜昭，河原達也，吉井和佳

■EA
（114）自然言語によって表現可能な概念とのマッピングにより、時系列データを理解するAI
　　　土肥宏太

■SLP
（115）共有IPAエキスパートを持つswitch Conformerによる多言語音声認識
　　　三村正人，Lee Jaeyoung，河原達也

（116）日本の消滅危機言語への事前学習済みASRモデルの適用：沖縄語首里方言とアイヌ語沙流方言を事例として
　　　松浦孝平，芦原孝典，河原達也

（117）階層的補助損失によるAligner-encoderの正則化
　　　Lee Jaeyoung，三村正人

（118）Cross-Attribute Fairness Inference in Speech Emotion Recognition via Task Arithmetic
　　　Woan-Shiuan Chien，Tomohiko Nakamura，Huan-Yu Chen，Satoru Fukayama，Hitoshi Suda，Jun Ogata，Chi-Chun Lee

（119）テキスト独立話者照合システムの言語依存性～コントロールされた条件下での評価～
　　　中村倫子，後藤晃，斉藤裕子，松浦廣樹，越仲孝文

■SIP
（120）河川一体制御のためのグラフ上データ同化による水位分布予測
　　　相馬蒔，金内尋夢，伊藤隆人，安田浩保，永原正章，村松正吾

（121）補助関数法に基づく相互相関関数最大化による相似変換画像の位置合わせ
　　　山下真司，木下裕磨，貴家仁志

（122）定常視覚刺激誘発BCIのためのランダムサンプリングによる信号強調
　　　鷲沢嘉一

（123）スペクトル分解の実装に依存しない一意なグラフフーリエ変換の構成
　　　宮澤拓弥，吉野夏樹，田中章

（124）ARivE: 河川水位一体把握・制御に向けた水位分布予測アプリケーション
　　　伊藤隆人，金内尋夢，安田浩保，永原正章，村松正吾

（125）ユーザ非依存条件下での脳波感情認識のためのドメイン適応型オンライン学習
　　　森航太郎，鷲沢嘉一

（126）脳波を用いた音響包絡追従解析に基づく言語音声に対する注意集中力の評価
　　　市川佳直，鷲沢嘉一

（127）超指向性音源とパルス圧縮技術を用いた不可視領域音響イメージングの高精度化に関する検討
　　　小松来夢，草野翼，大久保寛

（128）ニューラルネットワーク重みの量子化+低ランク分解のための実行可能性問題とDouglas-Rachford分割法
　　　鈴木陽人，山岸昌夫

（129）ニューラルネットワーク重みの三値量子化のための比較演算回数削減手法
　　　後藤優斗，山岸昌夫

（130）サブミリ厚試料のナノイメージングに向けた位相回復アルゴリズムの拡張
　　　赤石夏輝，矢田部浩平，高山裕貴

一括ダウンロード

音声言語情報処理（SLP）へ戻る

このページの先頭へ