情報処理学会第85回全国大会 会期:2023年3月2日~4日 会場:電気通信大学

5S-02
深層ブラインド音源分離を用いた転移学習による環境音分離
○合澤隆拓(東京工業大/産業技術総合研究所),坂東宜昭(産総研),糸山克寿(東京工業大/HRI-JP),西田健次,中臺一博(東工大)
音環境理解において雑踏環境下での音源分離は,環境音認識の基盤技術の一つである.環境音は音声と異なり,スペクトル構造が多様であり,事前にあらゆる環境に適応できるモデルを学習することが難しい.本研究では,非線形ブラインド音源分離法のひとつである深層フルランク空間相関分析法を用いた目的環境への教師なし転移学習を行う.事前学習データに含まれない未知の音源信号が混合音に含まれていても,多チャネル信号の空間情報を表す周辺尤度関数に基づき,混合音のみから分離モデルを改善するよう学習できる.環境音を用いた数値混合音により,推論データに対する教師なし転移学習の有効性を確認した.