情報処理学会ホームページ
FIT2013第12回情報科学技術フォーラム 開催日:2013年9月4日(水)~6日(金) 会場:鳥取大学鳥取キャンパス
抄録
K-055
オプティカルフローの方向特徴履歴とサポートベクトルマシンを用いた読唇の基礎的検討
高橋昌平・大谷 淳(早大)
ノイズの影響が多い状況下での音声認識や、聴覚障害者等の文字入力の支援を行うために動画像から唇の領域を検出し、唇の動きから話者が何を話しているのかを判断するシステムの開発を目指す。
まず、Haar-like特徴を用いて、顔画像の領域を検出し、その領域から目の領域も検出する。
顔全体と目との相対的な位置関係から唇の領域を特定する。
特定された唇の領域から発音時のオプティカルフローを計算し、時系列の特徴とする。この際、あらゆる方向のオプティカルフローをすべて特徴量とすると次元数が高すぎる為、ある方向の特徴量として量子化し、時系列にならべる。
その後、SVMを用い機械学習により認識を行う。