情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス 情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス

4Q-04
音声中の検索語検出における状態数の異なる複数の深層学習モデルを用いた検索精度の向上
○西野将弘,伊藤慶明,小嶋和徳(岩手県大),李 時旭(産総研)
近年、音声・動画データの大容量化と、それに伴うHDD等の記録媒体の高性能化により音声中からのキーワード検索機能の需要が増加している。先行研究では、音声データに対してモデルの事後確率からフレーム毎に最大値を算出した最尤系列を作成する音声データ最尤系列化方式を行うことで、Posteriorgram照合に比べ検索に要するメモリ容量を削減した。また、情報量削減に伴う検索精度低下の対策として、照合に複数の学習モデルを使用することで検索精度を向上した。本論文では、照合に事後確率の状態数が異なる複数の深層学習モデルを使用し、結果の検索スコアを統合することで、Posteriorgram照合から検索精度の向上を行う。