Robust Object Detection by Voting in Multiple Feature Spaces

(邦訳:複数の特徴量空間における投票システムを用いたロバストな物体検出手法)
 
王 志鵬
東京大学 特任助教

[背景]物体検出精度と速度の改善
[問題]情報融合により物体検出精度と速度の改善
[貢献]物体検出精度と速度を改善する手法を提案
 
 物体検出は人間の基本的知覚能力のうちの1つで,マシン・ビジョンに重要な役割を果たしており,効果的な検出方法はビデオ監視,運転補助などに応用されている.検出精度と速度を改善するために,よりよい表現モデル,よりよいクラシファイヤーあるいは解空間をより効率的に探索する方法が提案されてきた.

 本研究では,新しい方法で情報融合を探索し異なるチャンネルからの情報を組み合わせることにより検出精度と速度を改善する手法を提案する.本手法には2つの新規性がある:1)外観情報と運動情報を組み合わせること,2)同じ物体の局所画像特徴の中でコード化された外観と位置情報を組み合わせることの2つである.これらを利用した3つの検出方法を提案する.最も重要な部分はそれぞれの方法の投票システムである.

 最初に,実時間検出を主眼とした方法を提案する.この方法では,階層構造により時間がかるステップほど少数の対象になるような処理を行う.そのため外観情報と運動情報を非常に効率的に組み合わせ,時間軸に沿った局所外観運動パターンの投票を行う.本方法は強健かつリアルタイムである.

 1番目の方法は複雑なシーンにおいて有効ではないので,2番目の方法を提案する.この方法は,運動情報を組込むためにImplicit Shape Model(局所外観情報の投票システム)を拡張したものである.2つのデータセットによりこの方法は既存方法より高精度であることを確認した.この方法は重なりがある物体や類似物体の識別にも非常に有効である.

 2番目の方法の投票システムを高速化するために,PMS(Pyramid Match Score)を開発した.この方法では,トレーニング及び検出のいずれににおいてもピラミッドマッチングを行い,同じ物体の局所画像特徴の中でコード化された外観と位置情報を上手に使用することで効率化している.そのため,検出時間が高速である.
 


(2014年5月30日受付)
取得年月日:2014年3月
学位種別:博士(情報理工学)
大学:東京大学



推薦文
:(コンピュータビジョンとイメージメディア研究会)


本論文では,複数の特徴空間を用いた投票によって画像からロバストに車両や人物などを自動検出する手法を提案している.適用対象は主に交通分野で実用性も高く,また自動運転など今後の同分野の発展性を考慮しても非常に有益な研究であるため博士論文速報への掲載を推薦する.


著者からの一言


博士論文を推薦していただき,ありがとうございます.博士課程で学んだことを基にして,マシン・ビジョン分野に貢献できるように,研究開発活動を推進していきたいと思います.