情報処理学会第85回全国大会 会期:2023年3月2日~4日 会場:電気通信大学

1W-05
音声中の音声検索語検出における音声データの最尤および上位の状態系列の利用による検索精度向上
○皆川玲緒,小嶋和徳(岩手県大),李 時旭(産総研),伊藤慶明(岩手県大)
音声中の音声検索語検出では,深層学習モデルから算出した音声クエリと音声データの全事後確率ベクトル(Posteriorgram)を用いたPosteriorgram照合方式が提案されており,高精度な検索が可能である一方,メモリ使用量が多く検索に長い時間を要する.メモリ使用量と検索時間の削減のため,各フレームの事後確率ベクトルのうち最も確率値の高い状態番号の情報を用いた照合方式が複数提案されているが,2位以降の情報が失われているため検索精度が低下する.本稿では,各フレームの事後確率値のうち1位からn位までの状態番号を利用することで2位以降の情報を補完する,上位n件状態番号利用方式を提案する.