画像局所特徴量の共起性に基づいた人検出の高精度化に関する研究

 
山内 悠嗣

中部大学工学部 博士研究員


[背景]人を観る技術を実現するため
[問題]人検出の高精度化,省メモリ化
[貢献]実用的な人検出法の実現

人々の生活の利便性向上や安心・安全な社会の実現に向けて人を観る技術が必要とされています.人を観る技術とは,画像から人の位置の特定や人の追跡,人の動作を認識する技術です.特に,人検出は映像中から人の位置を特定するために必要な技術であり,人物追跡や動作認識を実現するためには前処理として必要不可欠です.しかしながら,人は服装や体格,向き,姿勢等により人の見えが大きく変動するため,画像中から人を高精度に検出することは容易ではありません.さらに,照明の変動や画像上での重なりによる人領域の隠れ,複雑な背景テクスチャ等も,人の検出に対して大きな影響を与えます.人検出技術を実用化する際には,このような見えの変動に対して頑健であることが必要とされます.また,低スペックなハードウェアにおいても動作するために人検出アルゴリズムを省メモリ化する必要があります.
 
このような背景を踏まえ,本研究では人検出の高精度化と省メモリ化について取り組みました.まず,人検出の高精度化として,人の局所的な形状の関係性を捉える共起確率特徴量を提案しました.共起確率特徴量では人体の構造を捉えるために,例えば画像から人の頭と肩を同時に観測できれば人,観測できなければ背景とします.このような人の複数の局所的な形状を組合せて評価することで,人の構造に基づいた大域的な形状を捉えることが可能となります.これにより,より人らしい特徴を捉えることができるため,人の形状に似ているテクスチャを持つ背景画像の誤検出を抑制することができます.
 
人検出アルゴリズムの省メモリ化としては,特徴量を表現するためのメモリ削減に取り組みました.特徴量は要素が実数かつ多次元ベクトルで表現されるため,膨大なメモリを消費します.そこで,本研究では実数で表現される特徴量の大小関係に基づき2値符号化し,複数の2値符号を組み合わせた2値符号列を特徴量として使用します.本手法は非常に簡単な演算で特徴量を2値符号化しながら,特徴量を表現するメモリ使用量を大幅に削減することができます.
 
このように,本研究では人検出の実用化を想定し,人検出の高精度化と特徴量の省メモリ化について取り組みました.本研究の一部はハードウェア化され,企業から発売されており,人を観る技術として貢献しています.今後は,人検出の実用化を加速させるために,人検出器の学習から識別までを効率的に行うアプローチの研究に取り組む予定です.


 
 (2012年8月31日受付)
 
取得年月日:2012年3月
学位種別 :博士(工学)
大  学 :中部大学

推薦文:(コンピュータビジョンとイメージメディア研究会)


B-HOG特徴量における量子化残差などによる検出性能の劣化という問題に対し,量子化残差に基づいた2値符号間の遷移尤度モデルを陽に導入した識別器を用いることで,量子化残差を積極的に活用し,検出性能を改善したアプローチは高く評価できる.よって「研究会推薦博士論文速報」特集に推薦する.

著者からの一言


学部生時代からお世話になった指導教授,共同研究者,研究室の皆様のおかげで充実した研究生活を送ることができました.また,これまでの研究活動を通して,研究するための体力と考える力を身に付けることができました.今後は,これまでに学んだことを活かし,社会に貢献できるような研究を行いたいです.