情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

1R-02
深層フルランク空間相関分析に基づく遠隔音声認識のフロントエンド
○合澤隆拓(東京工業大/産業技術総合研究所),坂東宜昭(産総研),糸山克寿,西田健次(東工大),中臺一博(東京工業大/HRI-JP)
雑踏環境下でも頑健な音声認識をする実現するには,音源分離により目的音源を抽出するフロントエンドが不可欠である.このような音源分離は,学習コストの観点から教師なしでの動作が望ましく,混合複素角度中心ガウス法や多チャネル非負値行列因子分解といった線形型確率モデルに基づく手法が提案されていた.本稿では,より高い表現能力をもつ深層フルランク空間相関分析 (neural FCA) に基づくフロントエンドを提案する.Neural FCAは,フルランク空間モデルと深層音源モデルを統合した非線形型確率モデルであり,従来の枠組みより精緻な分離性能を教師なしで獲得できる.Neural FCAを多人数対話のための音声認識フロントエンドとして拡張し,拡散性雑音を含む複数話者の混合音で評価した認識性能を報告する.