7N-07
Cycle GANを用いた音声匿名加工に必要なWORLD音響特徴の構成
本研究では,CycleGAN-VC(敵対的生成ネットワークによる声質変換手法)に基づく音声の匿名化処理において,音声分析合成システムWORLDで抽出した音響特徴量が話者の特定に与える影響を調査した. 具体的には,(1)WORLDによる特徴量抽出,(2)特徴量に対する様々な変換処理,(3)畳み込みニューラルネットワーク(CNN)分類器を用いた話者の分類を行い,分類正解率から各特徴量と変換処理の性質を分析する.結果として,非周期性指標からの話者特定はスペクトル包絡からの特定に比べ困難であることを確認し,各特徴量の変換処理の必要性を考察した.