5R-8
歌声-話声変換における動的音響特徴量が話声らしさに及ぼす影響
○山崎健史,池宮由楽,糸山克寿,奥乃 博(京大)
近年、CGMなどの普及と共に多様な音声合成技術が求められるようになってきた.
中でもSpeakBySingingでは歌声から話声への変換を目的としている。
従来法では、変換話声の話声らしさと元の歌声の声質との保持性について評価しているが、どのような処理が話声の自然性を生み出しているのかを深く吟味されていなかった。
歌声と話声の識別における音響的特徴として音韻長や音高、jitter、ビブラートに代表される動的成分等が挙げられるが、本稿ではその音響的特徴から歌声-話声変換の話声らしさに影響を与える主要な要素として動的な音響的特徴に着目する。
実験では、実録音声を各手法による変換結果を視聴者実験によって比較することで、どの音響的特徴が歌声-話声変換の話声としての自然さに影響を与えるのか評価した。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について