情報処理学会 第87回全国大会

7T-02
音声サンプルを用いた対象話者を除外可能な発話区間検出
○石森大路,武田 龍,駒谷和範(阪大)
音声対話システムにおいてシステム発話中のユーザによる割り込み発話を検出できれば,システムは発話中断などの対応が可能になる.しかしエコーキャンセラが利用できない環境で既存の発話区間検出器を用いると,ユーザ・システム発話の混合音から両者を区別できずどちらも検出してしまう.本研究では,音声サンプルを与えることでシステム発話を検出対象から除外できる発話区間検出器を提案する.具体的には,システムの音声サンプルから抽出した特徴表現を深層学習モデルに与え,特徴表現と類似する成分を入力混合音から除外する.実験では,割り込みや衝突を含む対話音声を用い,提案手法によるユーザ発話の検出性能を既存手法と比較する.