奥行き情報を利用した顔・髪の検出と追跡に関する研究

 
鈴木 一正

和歌山大学 システム工学部 研究支援員

[背景]顔画像処理における基礎的で重要な技術
[問題]顔・髪領域の検出・追跡
[貢献]ビデオレートかつ安定な顔・髪領域抽出の実現
 
 人を認識する上で顔は一番重要な情報を持っており,コンピュータビジョンの分野では,顔画像処理に関する研究が盛んに行われている.画像中に含まれる顔を検出・追跡する技術は,顔認識処理において初めに行われる基礎的で重要な処理であり,監視カメラ,マシンインタフェース,ロボットとの対話などさまざまな応用がある.そして,実際にさまざまな応用システムを開発するために,高速かつ安定なシステムが要求されている.

 髪色やスタイルなどは個人を特徴付ける重要な要素であり,個人識別の特徴として用いたり,髪型を利用したアプリケーションなどの応用が考えられる.しかし,色やテクスチャなどの情報が乏しく,髪領域に関する研究は少ない.

 本研究の目標は,高速かつ安定な顔や髪領域の検出・追跡システムを構築することであり,奥行き情報を積極的に利用することで,目標を達成する.ステレオカメラあるいはKinectから取得された奥行を含む画像から顔を高速かつ高精度に検出する方法を提案し,頑健に顔・髪領域を追跡するビデオレート(30FPS)のシステムを構築している.提案システムでは,検出された顔領域に基づいて環境に応じた顔・髪追跡モデルを構築し,自動的に追跡が開始できるシステムとなっている.

 従来の単眼カメラを用いた顔検出アルゴリズムでは,画像内の顔の位置や大きさは未知であるため,画像内から切り出したあらゆる位置と大きさの矩形領域を識別器に通し,顔か非顔かの判別を行う必要があるため,膨大な識別回数となり高速な処理が困難である.提案手法では,奥行き情報から画像上での顔の大きさを推定し,限定された大きさだけの顔を探索することで識別回数を削減しながら,同時に誤検出も減少することができる.このように,奥行情報を用いることで,検出精度を向上させながら単眼カメラよりも高速なビデオレートでの顔検出が可能となる.

 髪領域は,色情報やテクスチャが乏しく形状も大きく変化するため,安定な特徴を抽出することが難しく,これまでビデオレートでの追跡を行っている例は見当たらない.K-means Trackerというアルゴリズムは,画素の位置情報(画像のx, y座標)と色情報(R, G, B)からなる5次元特徴空間内にてK-meansクラスタリングを行い,画素を対象か背景に分類することで物体の追跡を実現している.本研究では,奥行き情報を追加した6D K-means Trackerを提案し,3次元化された位置情報によって特徴同士の分離性能を高めることで追跡の安定化を行い,髪領域の追跡を実現する.髪領域を追跡することで,頭部の姿勢にかかわらず従来より頑健な追跡が可能となる.また,画素単位の追跡により,リアルタイムに髪の3次元形状を取得することができる.

 提案する検出・追跡処理の高速化・安定化手法は,単に顔や髪領域だけでなく一般的な物体にも適用でき,さまざまな認識処理において役立つことが期待される.

 

(2016年6月10日受付)
取得年月日:2015年9月
学位種別:博士(工学)
大学:和歌山大学



推薦文
:(コンピュータビジョンとイメージメディア研究会)


本論文は,奥行情報と色を用いた顔と髪の検出と追跡の高速化と安定化に関する研究について述べられたものである.色彩情報の乏しく形状変化が大きい髪領域の追跡をビデオレートで実現できることは大きなインパクトがある.国際会議をはじめ,さまざまな場面で実機デモを行うことで提案手法の安定性も実証している. 


著者からの一言


本研究を進めるにあたり,長きに渡ってご指導いただいた指導教官やご協力いただいた研究グループの方々,また,学生生活を精神的,経済的に支えてくれた家族に心より感謝いたします.今後も研究の過程で得た経験を活かして頑張っていきたいと思います.