山内 悠嗣 中部大学工学部 博士研究員 |
[背景]人を観る技術を実現するため
[問題]人検出の高精度化,省メモリ化
[貢献]実用的な人検出法の実現
人々の生活の利便性向上や安心・安全な社会の実現に向けて人を観る技術が必要とされています.人を観る技術とは,画像から人の位置の特定や人の追跡,人の動作を認識する技術です.特に,人検出は映像中から人の位置を特定するために必要な技術であり,人物追跡や動作認識を実現するためには前処理として必要不可欠です.しかしながら,人は服装や体格,向き,姿勢等により人の見えが大きく変動するため,画像中から人を高精度に検出することは容易ではありません.さらに,照明の変動や画像上での重なりによる人領域の隠れ,複雑な背景テクスチャ等も,人の検出に対して大きな影響を与えます.人検出技術を実用化する際には,このような見えの変動に対して頑健であることが必要とされます.また,低スペックなハードウェアにおいても動作するために人検出アルゴリズムを省メモリ化する必要があります.
このような背景を踏まえ,本研究では人検出の高精度化と省メモリ化について取り組みました.まず,人検出の高精度化として,人の局所的な形状の関係性を捉える共起確率特徴量を提案しました.共起確率特徴量では人体の構造を捉えるために,例えば画像から人の頭と肩を同時に観測できれば人,観測できなければ背景とします.このような人の複数の局所的な形状を組合せて評価することで,人の構造に基づいた大域的な形状を捉えることが可能となります.これにより,より人らしい特徴を捉えることができるため,人の形状に似ているテクスチャを持つ背景画像の誤検出を抑制することができます.
人検出アルゴリズムの省メモリ化としては,特徴量を表現するためのメモリ削減に取り組みました.特徴量は要素が実数かつ多次元ベクトルで表現されるため,膨大なメモリを消費します.そこで,本研究では実数で表現される特徴量の大小関係に基づき2値符号化し,複数の2値符号を組み合わせた2値符号列を特徴量として使用します.本手法は非常に簡単な演算で特徴量を2値符号化しながら,特徴量を表現するメモリ使用量を大幅に削減することができます.
このように,本研究では人検出の実用化を想定し,人検出の高精度化と特徴量の省メモリ化について取り組みました.本研究の一部はハードウェア化され,企業から発売されており,人を観る技術として貢献しています.今後は,人検出の実用化を加速させるために,人検出器の学習から識別までを効率的に行うアプローチの研究に取り組む予定です.
(2012年8月31日受付)