5Q-04
敵対的生成ネットワークを用いた非パラレル声質変換
○蓮沼勇太,長尾智晴(横浜国大)
二者が異なる文章を発した音声を学習データとして変換を行う非パラレル声質変換において、敵対的学習による教師なしの変換手法を提案する。従来の声質変換ではメルケプストラム及びスペクトル包絡の二種の特徴量が主に用いられていたが、それぞれ良点・欠点があった。本研究ではそれらを同時に変換し統合して音声の生成を行う。これにより二者の良点を活かし、変換音声の目標話者との類似性・音声としての自然性を高める。また、敵対的学習の際、変換精度を高めるようなそれぞれの特徴量への効果的なノイズ付加の方法についても提案を行う。声質変換の実験を行い、従来手法よりも品質が向上されたことを確認した。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会