情報処理学会 第87回全国大会

2T-07
データセット拡張の規模による音声感情認識の検討
○生形優也,田村 仁(日本工大)
感情を理解することは円滑なコミュニケーションに重要でありAIが人との自然な対話の実現に必要不可欠である.近年,音声感情認識の研究は盛んに行われているが感情表現が多様かつ複雑であり推定が困難であるため課題の1つとして学習データの不足が挙げられる.声質変換を使用したデータ拡張を行ったところ認識率に変化はなかった.従来研究では声質変換に加えて時間収縮,周波数マスキング,ノイズ追加など一般的な音声データ拡張方法を行い3倍に拡張した実験では精度の向上が見られた.本研究では学習データ数の規模を増やして十数倍から100倍以上まで拡張させた時の影響について認識の性能向上を検討する.