5ZF-03
画像検索に基づく声優認識のための画像音声対収集支援システムの試作
○鹿田理央,大囿忠親,新谷虎松(名工大)
テレビなどを見ていると,発話者が画面上に存在していない場合,話者を知るためには話者認識を行う必要がある.話者認識を行う場合,認識対象の声を学習データとして収集する必要がある.しかし,認識対象の声を収録するのは手間がかかる. 本研究では,発話者が画面上に存在していない例としてアニメを取り上げ,アニメ動画から声優のデータを取得するための支援システムの試作を行う.アニメ動画を用いる場合,一般的にBGMなどが入っており,純粋な声のみを取得することはできず,認識が困難になる.そのため,本研究ではキャラクターの画像を利用してWeb上から声優のデータを取得し,そのデータと音声を結びつけることによって認識精度を高める.