弓場 竜 (株)日立製作所 |
[背景]映像セキュリティシステムにおける動画像認識技術への要求の高まり
[問題]環境条件による背景および人の見えの変化に対して頑健な手法の開発
[貢献]時空間特徴量の統計的学習を用いた動作認識のフレームワークの提案
監視カメラのディジタル化とともに動画像認識技術への要求が映像セキュリティシステムにおいて高まっている.この動画像認識技術では,カメラ映像を意味的に要約することで監視者の負担を軽減できるように,現状一般的な動体検知や滞留物検出に加えて人等の特定物体を検出する技術や人の動作を認識する技術のようなより多くの情報を認識できる先進的な技術が求められている.
先進的な動画像認識技術の実現には,環境条件により生じる背景の見えの変化に対する頑健さと人の見えの変化に対する頑健さという2つの大きな課題がある.前者は,照明条件の変化により画像中の背景の明度が変わるときや,樹木が風で揺れることで画像中の背景が動くとき等に求められる.後者は,カメラ視点の変化により画像中の人の向きが変わるときや,人の遠近により画像中の人の大きさが変わるとき等に求められる.
これら課題に対し,本研究では動画像中の見えと動きを捉える時空間特徴量と統計的学習を用いた動作認識のフレームワークを提案する.またフレームワーク中で,検知エリアへの動体の進入を検知する動体検知,検知した動体の中から対象カテゴリの物体を検出する物体検出,検出した物体の動作を認識する動作認識の各手法を提案する.
まず,カメラ画像中の背景を時空間特徴量と統計的学習によりモデル化した背景差分による動体検知法を提案する.この手法では,背景の見えが大域的かつ局所的に変化する状況下でも,誤検知を抑えて動体を検知することが可能になる.また,カメラ画像中を通過する人の見えと動きを時空間特徴の統計的学習により学習することで,人領域を検出し,人領域内の動きの非定常度を評価することで転倒動作を検出する手法を提案する.この手法では,背景中でエスカレータが定常的に動く状況でも,誤検出を抑えて人の転倒動作を検出することが可能になる.
さらに本研究では,距離画像センサと呼ばれる画像中の各画素の距離値を計測するデバイスを適用し,距離情報を用いることで人の見えの変化に対して頑健な動作認識の手法を提案する.
提案手法では,学習時と認識時の間のカメラ視点の変化に伴い人の向きが変化する時の動作認識を対象とする.まず学習時のカメラ視点における多数の学習サンプルから,カメラ視点が変化したときの3次元データと時空間特徴量を生成し,生成範囲のカメラの視点に応じた弱識別器を構築する.そして,この弱識別器と認識時のカメラ視点における少数の学習サンプルから,認識時の人の向きに最適な強識別器を構築する.これにより,学習サンプルの収集の手間を抑えつつ,向きが変化した人の動作を頑健に認識することが可能になる.加えて,距離画像センサを用いた動作認識をより多くの場所に適用していくために,エレベータ内のように対象とする人の直近に距離画像センサを設置する場所で課題となる人の一部が画角外にはみ出て欠損する状況に対応可能な手法を提案する.この手法では,欠損時と全身が映るときの時空間特徴量の相関性を利用した回帰推定により,時空間特徴量を補正することで動作認識の精度改善が可能になる.
先進的な動画像認識技術の実現には,環境条件により生じる背景の見えの変化に対する頑健さと人の見えの変化に対する頑健さという2つの大きな課題がある.前者は,照明条件の変化により画像中の背景の明度が変わるときや,樹木が風で揺れることで画像中の背景が動くとき等に求められる.後者は,カメラ視点の変化により画像中の人の向きが変わるときや,人の遠近により画像中の人の大きさが変わるとき等に求められる.
これら課題に対し,本研究では動画像中の見えと動きを捉える時空間特徴量と統計的学習を用いた動作認識のフレームワークを提案する.またフレームワーク中で,検知エリアへの動体の進入を検知する動体検知,検知した動体の中から対象カテゴリの物体を検出する物体検出,検出した物体の動作を認識する動作認識の各手法を提案する.
まず,カメラ画像中の背景を時空間特徴量と統計的学習によりモデル化した背景差分による動体検知法を提案する.この手法では,背景の見えが大域的かつ局所的に変化する状況下でも,誤検知を抑えて動体を検知することが可能になる.また,カメラ画像中を通過する人の見えと動きを時空間特徴の統計的学習により学習することで,人領域を検出し,人領域内の動きの非定常度を評価することで転倒動作を検出する手法を提案する.この手法では,背景中でエスカレータが定常的に動く状況でも,誤検出を抑えて人の転倒動作を検出することが可能になる.
さらに本研究では,距離画像センサと呼ばれる画像中の各画素の距離値を計測するデバイスを適用し,距離情報を用いることで人の見えの変化に対して頑健な動作認識の手法を提案する.
提案手法では,学習時と認識時の間のカメラ視点の変化に伴い人の向きが変化する時の動作認識を対象とする.まず学習時のカメラ視点における多数の学習サンプルから,カメラ視点が変化したときの3次元データと時空間特徴量を生成し,生成範囲のカメラの視点に応じた弱識別器を構築する.そして,この弱識別器と認識時のカメラ視点における少数の学習サンプルから,認識時の人の向きに最適な強識別器を構築する.これにより,学習サンプルの収集の手間を抑えつつ,向きが変化した人の動作を頑健に認識することが可能になる.加えて,距離画像センサを用いた動作認識をより多くの場所に適用していくために,エレベータ内のように対象とする人の直近に距離画像センサを設置する場所で課題となる人の一部が画角外にはみ出て欠損する状況に対応可能な手法を提案する.この手法では,欠損時と全身が映るときの時空間特徴量の相関性を利用した回帰推定により,時空間特徴量を補正することで動作認識の精度改善が可能になる.
時空間特徴量と統計的学習を用いた動作認識のフレーム
(2015年6月21日受付)