1V-03
自己教師あり音高推定手法PICIEにおけるキャリブレーションの改善
○石江悠眞,大野将樹,獅々堀正幹(徳島大)
SPICE(Self-Supervised Pitch Estimation)は音楽音響信号の音高(基本周波数)を推定する自己教師あり学習手法であり,2つの音楽音響信号の音高差を推定するモデルを訓練することで,間接的に音高を推定する.SPICEのキャリブレーション処理は,周波数が自明な合成音をSPICEの学習済みモデルに入力して得た音高の推定値を説明変数,合成音の周波数を目的変数として線形回帰し,音高の推定値を周波数に変換する.しかし,合成音と実際の音声は調波構造が異なるため,最適なキャリブレーションが実現できない.本研究では,少量の教師データを用いることでキャリブレーションを最適化する.歌唱データ1,000曲に対する実験により,提案法の音高推定精度が向上することを確かめた.