情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス 情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス

5Q-04
円形マイクアレーを想定した球面調和関数展開に基づく近接/遠方音分離T-Fマスク推定
○西口草太(法大),小泉悠馬,原田 登(NTT),伊藤克亘(法大)
物理モデルと深層学習を組み合わせた近接/遠方音源分離手法について,実機マイクアレーを想定したシミュレーションにより,実環境実験に向けたT-Fマスク推定モデルの検討と音質評価実験を行った.深層学習による音源分離ではディープニューラルネットワークや長短期記憶ユニット(LSTM)を用いて,混合音から求めた音響特徴量から時間-周波数(T-F)マスクを推定する.本論文では球面調和関数展開に基づく近接音分離法により,低周波数領域の近接/遠方音を推定し,これを音響特徴量に加える.従来のLSTMによるT-Fマスク推定手法と比べて分離音声の音質を向上し,実環境を想定した条件下での提案法の有用性を示した.