抄録
E-024
テキスト音声合成のための肉声を利用したアクセント型推定の検討
川島啓吾・大塚貴弘・古田 訓・山浦 正(三菱)
テキスト音声合成における、辞書への単語登録には、単語のアクセント型情報が必要である。音声言語に関する知識や経験がない場合、正しいアクセントの発声や、試聴による選択はできるが、単語のアクセント位置を特定することは困難である。そこで、アクセント型選択の簡易化を目的に、発声からアクセント型を推定する方式を開発している。
大規模韻律コーパス内のピッチパターンと、発声のピッチパターンの距離からアクセント型の候補を算出する方法を検討した。プロのナレータ2名が発声したデータを対象としたアクセント型の推定実験を行い、第一候補で79%、第二候補までで97%のアクセント型の正解率が得られ、本手法の有効性が確認された。