情報処理学会第84回全国大会講演論文集

1T-01

波形接続型音声合成における歌唱のピッチ変化予測LSTMモデル

○田中瑞穂，竹川佳成，平田圭二（はこだて未来大）

本研究では，波形接続型音声合成を用いた歌唱合成システムの歌唱技術を学習することで，ユーザによるパラメータ制御を支援することを目的とする．近年，統計的音声合成によって人間の歌唱を模倣する研究が注目されている．しかし，この手法では，高速歌唱などの人間歌唱が困難である合成音声特有の歌唱技術に対応できない．
そこで，本研究では，手動で調節した歌唱合成システムの楽譜のテキストデータをLSTMで学習した．この学習したLSTMを用いて，未知の楽譜のパラメータを予測及び生成した．なお，学習するパラメータは，ポルタメントやヴィブラートなどピッチを変化させて抑揚をつける機能に焦点を当てている．