情報処理学会 第88回全国大会

5ZE-04
条件付き発話区間検出における登録音声圧縮手法の対話コーパスでの評価
○深澤俊介,武田 龍,駒谷和範(阪大)
モノラルマイクを用いる音声対話システムでは,ユーザ発話とシステム発話が混在するため,両者の識別が必要となる.この状況では登録音声で条件付けする発話区間検出(VAD)が有効だが,登録音声の長尺化により計算量が増大し遅延が発生する.本研究では,実運用を想定し,システム側の登録音声を圧縮して入力長を削減するVAD手法を提案する.まず,登録音声から代表的なパターンを抽出し,冗長成分を除去することで計算量を削減し,リアルタイム性を向上させる.さらに,残響や雑音を含む学習データを使用し,頑健性を向上させる.公開されている対話コーパスを用いた評価では,検出精度を維持しつつRTFが改善されることを確認した.