5T-3
話者の負担を考慮した話者識別と音響モデルの検討
○楠 和馬,奥村紀之(香川高専)
近年では音声認識技術に触れる機会が増えてきている。本来、
人間は少数人から同時に話しかけられても誰であるか判断する
ことや、少数人の話の内容を聞き取ることができる。しかし、
音声認識技術において混ざった音声を分離することや話者の識
別をする機能を付加することは困難である。他の研究では複数
のマイクを利用し複数話者音声認識を行うことや、GMMを利用
して話者識別を行うことが一般的である。だが、話者の特定を
する場合には話者音声データが必要になり、話者への負担がか
かりユーザに不便さを感じさせてしまう。そこで、単一マイク
ロフォンによる話者データの収集を必要としない話者識別を実
装するため音響モデルや雑音棄却について検討する

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について