情報処理学会 第88回全国大会

6ZE-08
Style-Bert-VITS2を用いた災害時避難を促す緊迫感のある音声合成
○横田小次郎,伊藤克亘(法大)
東日本大震災では避難呼びかけが丁寧で穏やかであったため、避難行動につながりにくかったと指摘されている。その後、NHKでは呼びかけ表現が見直され、能登半島地震では強い口調のアナウンスが多くの人に緊迫感を伝えた。この背景から、状況に応じて適切な緊急度を表現できる音声合成の活用が有効と考えられる。しかし、既存研究では、緊迫感を付与した音声は聞き取りやすさが低下するなど課題が残る。本研究では、Style-Bert-VITS2という音声合成モデルを用いて、聞き取りやすさと緊迫感を両立した避難音声の生成を目指す。生成音声に対して主観評価実験を行い、避難行動促進に寄与する音声特徴を検討する。