1T-02
2,000時間の音声データ中の検索語検出におけるメモリ使用量及び検索時間の削減
○三上 凌(岩手県大),李 時旭(産総研),伊藤慶明(岩手県大)
本研究では、音声データ中から特定の単語が話されている区間を検出するタスク(Spoken Term Detection)において、検索時間を削減する手法を提案する。提案手法では、全音素3gramで事前に各発話を検索しておき、各発話に対して最小距離を保持しておく。クエリが与えられると、クエリの3gramから事前に求めた距離を用いて、各発話に対してクエリとの近似的な距離を算出する。これにより、高速な検索が実現できる一方で、事前に求めた距離を保持するため必要メモリ量が大きくなる。そこで保持する距離を小さいものに限定することにより削減を行った。2000時間の音声データを用いた評価実験で効果を検証した。