1V-04
MFCCベースミックスに基づく歌声分離のためのデータ拡張
○米澤源太,大野将樹,獅々堀正幹(徳島大)
歌声分離とは,歌声と伴奏音の混合信号から,歌声信号のみを分離,あるいは,特定の楽器音信号を分離する技術である.歌声分離を行う場合,大規模かつ高品質な学習データが必要であるが歌声と楽器音が個別に録音された学習データセットを人手で作成することは困難である.Yuanらはクロマベースミックス法と呼ばれる楽曲間の伴奏の和音構成が類似している場合に混合するデータ拡張手法を提案し,不協和音を含む不自然な学習データが生成される問題を低減している.本研究は和音の類似性に加え,音色の類似性に着目したデータ拡張手法を提案する.