1R-07
アノテータごとのばらつきを考慮した音響イベント検出
○古賀直樹(同志社大 / 産総研),坂東宜昭(産総研),井本桂右(同志社大 / 産総研)
本稿では,複数のアノテータが作成したばらつきのあるラベルを用いた音響イベント検出 (SED) について述べる.音響イベントの開始・終了時刻と種類を推定するSEDでは,教師データの品質がモデルの性能に直結するが,イベントの開始・終了時刻は主観的なためアノテータによってラベルがばらつく.そこで本研究では,アノテータの違いを陽にモデルに組み込んだ Crowd Layer をSEDの推論モデル CNN-BiGRU に導入することで,本問題に対処する.複数人のアノテータによる30時間の実録音データセットを構築し,提案法の有効性を評価した.