4P-1
複数サブワード認識結果統合による音声中の検索語検出の精度向上 -複数の音響モデル・言語モデルの利用-
○斉藤裕之,伊藤慶明,小嶋和徳,石亀昌明(岩手県大),田中和世(筑波大),李 時旭(産総研)
現在,記録媒体の大容量化に伴いマルチメディアデータの利用機会が増加し,これに対する簡便な検索手法として音声中の検索語検出(STD)が注目されている.現状の音声中の検索語検出では,辞書登録語は大語彙連続音声認識システムで,辞書未登録語はサブワード認識システムの出力結果を用いる手法が一般的である.辞書登録語は比較的高精度で検出可能だが辞書未登録語は一般的に辞書登録語と比較し検出精度は劣り,この問題への効果的な対応策が求められている.本研究では辞書未登録語(未知語)への対応を目指し,複数の音響モデルと言語モデルを用いて複数のサブワード認識結果を出力し,統合することで未知語問題への対応と音声中の検索語検出の精度向上を図る.