情報処理学会 第86回全国大会 会期:2024年3月15日~17日

5R-04
音声認識の音響特徴を用いた音声感情認識システムの構築と分類精度向上に関する検討
○中村優太,高野 毅(電機大),鄭 雄一(東大),高橋達二,篠原修二(電機大)
人間と機械の音声によるコミュニケーションでは, 話し手の感情や意図の理解が重要である. 本研究では, 心理学の基本感情説に基づき, 音声認識のw2v2-l-robustモデルの隠れ層を音響特徴としてNNや決定木を用いた喜怒哀の3感情の強度を推定する音声感情認識システムを構築した. MSP-Podcastデータセットで学習を行い, IEMOCAPデータセットで検証を行なった. さらに感情ごとに推定値のばらつきがあることに着目し, Youden indexを用いたカットオフを揃える手法を考案した. その結果, この手法で分類精度を向上できる可能性が示唆された.