4ZE-02
距離ベース時間マスキングと話者情報を組み合わせた二段階処理によるロバスト音声強調
○瀬高 亮,糸山克寿(東京科学大)
本稿では、近距離音声強調手法の環境変化に対する頑健性の向上を目的とし、距離ベース時間マスキングと話者情報を組み合わせた二段階処理による音声強調手法を提案する。従来の時間周波数マスクに基づく近距離音声強調法は、部屋固有の周波数特性の影響を受け、収録環境が変化すると強調性能が変動してしまうという問題がある。本手法では、入力混合音に対し、周波数特性に依存しない時間マスクにより目的話者の発話区間を抽出し、話者の特徴を利用することで環境変化に頑健な近距離話者の音声強調を可能にする。評価実験の結果、異なる環境に対しても一貫した音声強調性能を示し、提案手法の有効性を確認した。