4T-03
深層ブラインド音源分離に基づく音響イベント定位・検出の大規模事前学習と弱ラベル転移学習
○野﨑雄斗(産総研 / 東大),坂東宜昭,大西正輝(産総研)
本稿では,事前学習と弱ラベル転移学習により低コストに構築可能な音響イベント定位・検出(SELD)について述べる.SELDは深層ニューラルネットワーク(DNN)により高い性能を期待できるが,その教師あり学習には高コストな音源到来方向(DoA)のアノテーションを要する.そこで本研究では,低コストな合成音で大規模事前学習したDNNを,少量のDoAラベルのみを用いて弱ラベル転移学習するSELDの構築法を提案する.具体的には,汎化性能の高い分離行列推定アルゴリズムを内包するDNNの大規模事前学習と,教師なしでDoA推定結果の尤もらしさを記述できる深層ブラインド音源分離に基づく転移学習を構築する.