情報処理学会 第83回全国大会 会期:2021年3月18日~20日 会場:オンライン開催 情報処理学会 第83回全国大会 会期:2021年3月18日~20日 会場:オンライン開催

7N-03
教師ありモノラル音声分離のための残響音声データ内の単一話者区間を活用した転移学習
○生嶋竜実,武田 龍,駒谷和範(阪大)
残響下の教師ありモノラル音源分離・残響除去を統合的に行うモデルが提案されている.特定の残響への転移学習には残響下の混合音声とクリーン音声のペアが必要となる.実際の分離対象データは単一話者の発話部分と混合発話部分からなる.このデータは残響を含むため,転移学習にはクリーンな音声を使えない問題がある.本研究では残響音声の単一話者部分を活用した転移学習を行う.単一話者音声を混合した学習用データを作成し,混合音声を各話者の残響音声に分離するよう既存モデルを転移させる.分離後の各音声は教師なし残響除去手法でクリーン音声へ復元される.2話者の残響音声の分離実験で転移学習の有効性を信号対歪比で確認した.