6M-02
遠隔音声認識のためのブラインド音源分離に基づくビームフォーマ
○島田一希,坂東宜昭,板倉光佑,三村正人,糸山克寿,吉井和佳,河原達也(京大)
本稿では、遠隔音声認識のための音声強調について述べる。録音信号に含まれる雑音は認識性能を大きく低下させるため、前処理として雑音を除去し目的音声を強調することは遠隔音声認識において不可欠である。マイクロホンアレイを用いた音声強調手法が活発に研究されており、アレイの配置や雑音の音源数・音色といった事前情報を用いず頑健に動作することが課題である。また認識性能低下の要因となる分離歪みの影響を抑えることも課題となる。本研究では、ブラインド音源分離により推定した空間相関行列に基づくビームフォーマを提案し、これらの課題を包括的に解決する。CHiME-4のデータを用いて、提案手法の有効性を評価した。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会