6N-04
音声中の音声検索語検出における平均事後確率ベクトル圧縮方式の検索精度改良
音声中の検索語検出において,DNNから算出した音声データの全事後確率ベクトル(Posteriorgram)を状態ごとの平均事後確率ベクトル(APPV)に圧縮することで,検索時のメモリ使用量の削減を行う方式を提案した.この方式では,音声データのPosteriorgramを求め,各フレームの事後確率ベクトルの要素の中で最も事後確率が高い要素(状態)を最尤状態とし、そのフレームにその状態番号を対応させる.同じ最尤状態を持つフレームの事後確率ベクトルをAPPVしている.最尤状態は学習モデルに依存するため,誤っていることも考えられる.本稿では,複数の学習モデルから求めた最尤状態を用いたAPPVの改良方式を提案する.