情報処理学会第85回全国大会

笑い声合成は対話システムなどで，より自然な対話の実現に必要なものである．しかし通常の音声合成と異なり，笑い声は陽に音素化できない．先行研究では自己教師あり学習の一種であるHuBERTを用いて笑い声を含む音声波形から離散表現を獲得し，それを通常の音声合成モデルの入力として用いることで笑い声を生成する．本研究では，HuBERTにより獲得された離散表現の分析を行い，また，音声合成モデル内で笑い声のスタイル制御に必要な有声音・無声音の割合を制御することで，多様な笑い声の生成を目指す．