情報処理学会 第88回全国大会

4ZE-08
音声感情認識のための声質変換を使用したデータ拡張
○生形優也,田村 仁(日本工大)
感情認識は人が円滑なコミュニケーションを行うのに重要なものであり,人と機械との自然なコミュニケーションの実現に必要不可欠なものである.音声感情認識の研究の課題として感情ラベル付きのデータセットに含まれる人数が不足しており,学習を行うと特定個人の声質やその他の特徴量が過学習されて認識精度が低下してしまう問題がある.そこで本研究では,不足しているデータセットに中立と感情音声の混合や声質変換,hubertを使った特徴抽出による拡張手法を検討する.声質変換にはボイスチェンジャを使用し,中立のみに声質変換を行うことで感情分類の精度に影響を与えずに多人数のデータセットを拡張できるかを実験で検証する.