4T-2
話者ダイアライゼーションシステムのための音声区間検出および到来方向推定の精度向上の検討
○黄 楊暘,大塚琢馬(京大),中臺一博(HRI-JP),奥乃 博(京大)
ロボット聴覚では, いつ, どこで, 誰が話したかを解
明する音環境理解機能が不可欠である. 本稿では,
それらの問題を解決するために, 音声区間検出, 到
来方向推定および話者同定技術を組み合わせた処理を
話者ダイアライゼーションシステムとする.
ロボット聴覚ソフトウエア HARK においては,
MUSIC アルゴリズムを前処理として, 音声区間検出
および到来方向推定を行っている. しかし, MUSIC
スペクトルに基づいて処理を行う際に, 音源数パ
ラメータおよび閾値パラメータが結果を大きく
左右する.
本稿では, ブラインド音源分離を前処理とする話
者ダイアライゼーションシステムを提案した. 音量
閾値パラメータの設定は依然必要であるが,
精度向上したパフォーマンスが得られている.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について