4S-2
マルチモーダル情報を利用した未知語を含む発話のドメイン選択精度の向上
○高橋裕己(早大),中野幹生(早大/ホンダRIJ),岩橋直人(京大),左  祥(京都工繊大),船越孝太郎(ホンダRIJ),岡 夏樹(京都工繊大),菅野重樹(早大)
マルチドメイン対話システムにおいては,ユーザの各発話が,どのタスクドメインの発話かを判定する必要がある.このとき,発話中に未知語,すなわち音声認識・理解部にとっての未登録語があると,音声認識・理解の誤りが起こり,ドメインの判定が難しくなる.本論文では,音声認識確信度や文型との適合性などの特徴を用いて未知語検出とドメイン推定を同時に行い,さらに音声認識の結果に加えて,カメラの画像からの特徴も用いてマルチモーダルにドメイン選択を行うを提案する. また,提案手法を発話コーパスに適用したドメイン推定・未知語検出の実験の結果を示す.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について