4U-7
複数音源下での擬音語による音源選択システム
○山村祐介,高橋 徹,尾形哲也,奥乃 博(京大)
本研究では擬音語に基づいて混合音から音源を選択するシステムを開発する.

計算機による音環境理解においては,
特定の音源に対するユーザとシステムの共通認識が重要である.
その共通認識の橋渡しとして,擬音語を使用する.
何故なら擬音語は,大量の音源から特定の音源を簡素に表現できる点で適するからである.

本稿ではユーザの指定する擬音語と混合音を入力とし,
その擬音語に類似した混合音中の音源をユーザに提示するシステムについて述べる.
このシステムの実現には,以下の3つの課題がある.
(1)複数音源の混合音の分離
(2)各分離音の擬音語変換
(3)ユーザが指定した擬音語と変換された擬音語との類似度評価

これらの課題に以下のように対処する.
(1)ロボット聴覚ソフトウェアHARKによる音源分離
(2)HMM音素認識による擬音語の音素変換
(3)編集距離に基づくランキング

実験では72種類の環境音から3種類の音源が混合された場合に,
ユーザの意図した音源を選択できた割合を評価する.
その結果,
擬音語で特定の音源が選択可能だと分かった.