情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス 情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス

5S-01
バイナリマスク付き非負値行列因子分解に基づく音源分離手法の発音時刻ずれに対する性能評価
○日下湧太,糸山克寿,西田健次(東工大),中臺一博(東工大/ホンダRIJ)
本稿では,目的音源の発音時刻を事前情報として利用するバイナリマスク付き非負値行列因子分解による音源分離手法において,入力される発音時刻に時間のずれが含まれている際の分離精度の変化について評価を行う.複数の楽器により構成されるモノラル音響信号から特定の音源のみを分離する処理には目的音源の事前情報を利用する手法が主流となっており,ユーザが容易に作成可能な事前情報として目的音源の発音時刻を利用する音源分離手法を提案した.これまでの報告では,提案法に入力する発音時刻はMIDIやアノテーションから作成した理想的な状況に限られていた.本報告では人間が発音時刻を作成する際に発生する時間のずれをモデル化し,これを用いて音源分離のシミュレーションと分離精度評価を行った.