情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス 情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス

4Q-01
授業グループワークの音声認識精度改善のためのマルチチャネルVAD
○中野魁人(滋賀大),中山隆弘,白水 始(東大),市川 治(滋賀大)
教育の新しい試みとして、数名のグループに分かれて発見的な学習を行う仕組みが注目されている。その際、個々の生徒に接話マイクロフォンを装着してもらい、発言を音声認識することにより、学びの過程を可視化することが行われる。しかし、接話マイクロフォンといえども、収録の音声トラックに隣接話者の音声が混入することが多く、音声認識の湧き出し誤りとなることが多かった。これは、従来型のVADを併用したとしても、十分に改善されなかった。

本報告では、グループ内の全員の音声トラックを参照することで、対象となる話者の発話区間をより高精度に推定するマルチチャネルVADを提案し、音声認識の湧き出し誤りが効果的に減少することを示す。