7M-05
話者の感情印象の変化を抑制する話速変換手法
○江田燎平,伊藤克亘(法大)
ドラマ、アニメーションを聴取時において、話者の感情と話速変換後の印象が一致する話速変換システムを作成する。話速変換に関する従来研究では、「ニュースや報道番組での言語内容の理解度向上」を目的としたものが多く、話者の感情について考慮した研究は少ない。また、話速変換を行うことにより話者の感情が変容することが明らかになっている。そこで本研究では、話速変換手法としてWSOLA(Waveform Similarity based OverLap-Add)をベースに改良を行い、話者の感情の保持を行う。具体的には、発話におけるアクセントに着目し、アクセント箇所の時間伸縮率を設定する手法を用いる。
感情音声に話速変換を行い、被験者10名に聴取させ、話速変換前と変換後で感情が変容しているかどうかをMOS評価を用いて5段評価する。さらに、WSOLAと本手法の比較実験も同時に行い、その結果について報告する。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会