6ZE-05
TTSにおける非言語的ノイズの再現に向けた音響的特徴の定量分析
○南方雄幸,柳 祐希,藤村春允,藤村真生(阪工大)
本研究は、AI音声に自然な肉声感を再現することを最終目標とする。現在の音声合成技術はクリアな発生を実現する半面、息遣いや声のかすれといった非言語的ノイズを再現しておらず、話者の意図や心境を伝える情報が欠如している。
そこで本研究は、音響分析ツールを用い、肉声から生理的ノイズの音響的特徴を定量分析する手法を提案する。得られた数値を音声合成システムの調整パラメータに直接マッピングし、ノイズを疑似的に再現する。最終的に、ノイズ再現音声と肉声を比較する主観評価を実施し、手法の有効性を検証する。本成果は、AI音声における存在感の向上と、制作現場の感覚的な調整の削減に資する知見を提供する。