2T-08
音節列からの未知語検出のための単語N-gram確率を用いた過分割抑制
○大塩 幹,武田 龍,駒谷和範(阪大)
音声発話から未知語を認識し語彙獲得する音声対話システムの構築には、音声発話からの未知語検出が不可欠である。既存の音節認識と単語分割を直列に組み合わせる未知語検出手法では、過分割が発生し検出精度を低下させる問題がある。本研究では、単語N-gram確率を活用した過分割抑制手法を提案する。過分割箇所では単語の接続が 不自然になることに着目し、単語N-gram確率で不自然な接続か判定する。判定結果を用いて過分割された未知語を適切に連結し、過分割を抑制する。提案する過分割抑制手法により未知語検出精度の向上を確認した。