情報処理学会デジタルプラクティス  Vol.8 No.2 (Apr. 2017)

「社会に浸透する画像認識」特集号について

佐藤 敦1  福島 俊一2

1日本電気 (株)  2国立研究開発法人 科学技術振興機構 

生物は長年にわたる進化の過程を経て,強力なパターン認識能力を獲得してきました.人間が外部から受け取る知覚の8割以上は視覚情報といわれるように,実世界を視覚で捉えて判断することは,生物が生き残るために食糧を得たり,あるいは捕食される危険を回避する上で,きわめて重要な機能です.この視覚情報を工学的に取り扱う画像認識技術は,コンピュータの処理能力の向上に伴って進展し,産業の効率化,社会の安全安心,あるいは快適性を高めるために,さまざまな領域で社会に浸透しています.目視作業という単純作業から人間を解放するだけでなく,人間の判断を支援したり,人間が取り扱えないほどの大量の画像を解析したりすることで,これまで得られなかった新たな価値の提供も可能になってきました.

 

近年,深層学習(ディープラーニング)の進展により,画像認識技術は新たな展開を迎えています.機械学習は,これまで主に識別器の設計方法として研究されてきましたが,深層学習の登場によって特徴抽出器の高精度な設計も可能になってきました.対象を限れば,人間の認識精度を超えるとの報告もありますが,その一方で,大量の学習データが必要になり,そのことが実利用に向けての課題にもなっています.

 

本特集号では,このような画像認識技術の新たな展開を見据えて,画像認識技術の実問題への適用に際して実践した事例の紹介や,そこから得られた知見などを,6件の招待論文としてまとめました.

 

1件目は,日立製作所の佐川氏らによる「設備保守の教育研修支援を目的とするAR技術の開発と評価」です.熟練作業者の作業スキルを継承し,作業品質を向上させるための作業者支援技術として,AR(拡張現実)技術を用いた教育研修支援システムを開発した内容です.ユーザ評価とその結果に基づく改良についても紹介しています.

 

2件目は,東芝の岡田氏らによる「自動車の運転支援・自動化のための画像センシング技術とその実践」です.近年,自動車事故を未然に防ぐ自動緊急ブレーキ等が実用化されており,さらに自動運転へと発展しつつあります.このような運転の支援や自動化を実現するためには,自動車周辺の道路環境を認識する必要があり,画像認識は大きな役割を担っています.そのための画像認識アルゴリズムや,実時間動作させるための車載画像認識プロセッサを紹介しています.

 

3件目は,情報通信研究機構の石寺氏らによる「豊島区総合防災システムにおける群衆行動解析」です.大きな災害が発生したとき,自治体は迅速かつ適切な対応が求められます.駅等の公共エリアに群集が押し寄せた場合,危険な状態を回避するために,退避経路の確保や誘導等を迅速に行う必要があります.これを支援するために開発した,群衆の混雑度や動きを捉える群集行動解析技術と,豊島区総合防災システムへの導入事例の紹介です.

 

4件目は,日本電気の岩元氏らによる「映像「指紋」技術Video Signatureの開発―その研究開発,国際標準化,そして事業化の実践―」です.インターネットの普及に伴い,映像の不正コピーが横行し,映像の身元を識別できる仕組みが求められるようになってきました.人間の指紋と同様に,映像自体から固有で頑健な特徴量を抽出し,それをIDとして映像を識別する技術Video Signatureを開発した内容です.本技術はMPEG国際標準にも採用されました.その標準化活動や,事業化の取り組みについても紹介しています.

 

5件目は,日本IBMの中野氏らによる「さまざまな分野で活用されるマルチモーダル・マイニング」です.インターネット上に存在する多くのドキュメントには,テキストと画像や図表が混在しています.テキストだけ,あるいは画像だけのマイニングでなく,両者を統合したマルチモーダル・マイニングによって,新たな知見を得ようとする取り組みの紹介です.対話型ロボットでの視覚情報と音声情報の統合解析,医用画像と診断情報の統合による診断支援システムの構築についても紹介しています.

 

6件目は,富士通の石原氏らによる「医師の画像診断業務を効率化する画像位置合わせ機能の開発」です.異なる日時に撮影された同一人物の検査画像の比較を容易にする,画像位置合わせ機能を開発し,医師の画像診断業務を支援する内容です.医用画像を扱う上で知っておきたいデータ,必要なツールや開発知識についても紹介しています.

 

また,本特集号には,日立の米司らによる「駅構内モニタカメラを用いた混雑度可視化技術」が投稿されました.駅構内での事故を未然に防止するために,混雑度情報を事業者や利用者に提供する取り組みです.カメラ映像をそのまま情報提供するのではなく,人流計測結果や人物をアイコン化した映像など,利用者のプライバシを保護した上で,分かりやすく可視化するアプリケーションを紹介しています.

最後にご紹介するのは,「画像認識応用におけるディープラーニングのインパクト」をテーマに開催した座談会です.機械学習のコモディティ化によって,十分な量の学習データがあれば,画像認識の専門家でなくても精度の高い画像認識が実現できるようになってきました.このような大きな転機を迎える中で,画像認識の専門家は今後何を目指したらよいのか,議論は大いに盛り上がりました.ぜひご一読ください.

今回,多くの方に執筆や座談会への参加をお願いしました.お忙しい中ご協力いただきまして,誠にありがとうございました.このような特集を通じてプラクティスとしての情報を共有し,実世界の問題解決に向けて,画像認識技術が今後さらに発展することを期待します.