情報処理学会第75回全国大会講演要旨

4T-5

音声Captcha の自動解析に向けたSingle Channel混合音声の数字認識

○佐野正太郎，大塚琢馬，奥乃　博（京大）

本研究では音声Captcha の自動解析に向けたシングルチャネル混合音声の数字認識問題を扱う. 近年の一般的な音声Captcha では複数の数字ターゲット音に対して別話者音声・同一話者音声などの妨害音がシングルチャネルで混合されている. これを自動解析するためには, 次の4 つのモジュールが必要である: (1) ターゲット音のセグメンテーション・セパレーション, (2) 妨害音の抑圧, (3) ターゲット音声の特徴量抽出, (4) ターゲット音声の認識. これまでのところ, (1) を既知の情報とし,数字発話データベースTIDigits と認識器Support Vector Machine を用いた予備実験により, 予めセグメント化されたターゲット音声に対する数字認識性能を評価した.

情報処理学会 第75回全国大会講演要旨

情報処理学会第75回全国大会講演要旨