イベント企画
トップコンファレンスセッション3
コンピュータビジョン
9月1日(火) 15:30-17:30
第4イベント会場
座長 長原一(阪大)
座長補佐 橋本敦史(オムロンサイニックエックス)
15:30-15:50 講演(1) 【タイトル邦題】 レンズ収差を利用した単眼デプス計測
柏木 正子(東芝 研究開発センター AI研 メディアAIラボラトリー)
【原発表の書誌情報】 Masako Kashiwagi, Nao Mishima, Tatsuo Kozakaya, Shinsaku Hiura.: Deep Depth from Aberration Map, The IEEE International Conference on Computer Vision (ICCV), 2019, pp. 4070-4079.
【概要】 本論文では、市販の単眼カメラで撮影した1枚の画像だけを用い、被写体の距離や画像の位置で異なる、レンズ収差に基づくぼけの色付きを、深層学習を用いて解析し、被写体までの距離を計測する手法を提案する。屋外画像を用いた評価実験により、ステレオカメラ並みの精度で距離計測ができることを実証した。
【略歴】 2006年株式会社東芝入社。裸眼立体表示デバイスの研究開発を経て、2018年より単眼デプス計測の研究開発に従事。
15:50-16:10 講演(2) 【タイトル邦題】 分類と再構成の同時学習に基づくオープンセット認識
吉橋 亮太(ヤフー株式会社)
【原発表の書誌情報】 Yoshihashi, R., Shao, W., Kawakami, R., You, S., Iida, M., and Naemura, T.: Classification-Reconstruction Learning for Open-Set Recognition, in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp.4016--4025 (2019).
【概要】 機械学習では学習データに含まれていなかった「未知」の物体が誤認識を引き起こすことがある。そこでオープンセット認識では未知物体を学習済みの既知物体から正確に分離・棄却することを目指す。本研究では畳み込みニューラルネットにおいて既知クラスの分類と同時に、入力を潜在表現から再構成する自己符号化を学習することでオープンセット認識器の未知事象に対する頑健性が向上することを示す。
【略歴】 2014年東京大学工学部電子情報工学科卒業、2019年同情報理工学系研究科電子情報学専攻博士課程修了。2016年から2019年まで日本学術振興会特別研究員(DC1)。2019年よりヤフー株式会社にて画像処理に関する研究開発に従事。IEEE、CVF各会員。
16:10-16:30 講演(3) 【タイトル邦題】 Attention Branch Network:視覚的説明を用いたAttention機構の学習
福井 宏(NEC バイオメトリクス研究所)
【原発表の書誌情報】 H. Fukui, T. Hirakawa, T. Yamashita and H. Fujiyoshi, "Attention Branch Network: Learning of Attention Mechanism for Visual Explanation", The IEEE Conference on Computer Vision and Pattern Recognition, 2019, pp. 10705-10714.
【概要】 認識結果に対する判断理由を可視化できる視覚的説明は、深層学習の認識結果に対する判断根拠をユーザへ伝えること可能であるが、認識精度向上には貢献しない。提案するAttention Branch Networkは、視覚的説明のAttention mapをAttention機構に応用することで、認識精度向上と視覚的説明の両方を実現可能である。
【略歴】 2019年中部大学大学院博士後期課程卒業。NECバイオメトリクス研究所。研究は画像における機械学習・深層学習の研究に従事。
16:30-16:50 講演(4) 【タイトル邦題】 ドメイン適合を用いた物体検出のための強弱分布アライメント
原田 達也(東京大学 先端科学技術研究センター)
【原発表の書誌情報】 Saito, K., Ushiku, Y., Harada, T., Saenko, K.: Strong-Weak Distribution Alignment for Adaptive Object Detection, The 32nd IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), pp. 6956-6965 (2019).
【概要】 物体分類器のドメイン適合には、敵対的損失を用いて大域画像レベルで元画像と対象画像の分布を一致させるアプローチが有効であるが、物体検出にはうまく働かない可能性がある。そこで、本論文では強い局所的アライメントと弱い大域的アライメントに基づく物体検出のための新しいドメイン適合手法を提案する。
【略歴】 2013年より東京大学大学院情報理工学系研究科教授。2019年同大学先端科学技術研究センター教授。研究分野は、画像認識、機械学習、知能ロボット。2001年東京大学大学院工学系研究科博士(工学)取得。現在、理研AIP医用機械知能チームのチームリーダー、国立情報学研究所(NII)医療ビッグデータ研究センターの副センター長を務める。
16:50-17:10 講演(5) 【タイトル邦題】 時間分布上の異方性比率に着目した撮像ノイズに頑健なVideo Magnification
武田 翔一郎(NTT メディアインテリジェンス研究所 研究員)
【原発表の書誌情報】 Takeda, S., Akagi, Y., Okami, K., Isogai, M., Kimata, H.: Video Magnification in the Wild Using Fractional Anisotropy in Temporal Distribution, Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), pp. 1614-1622 (2019).
【概要】 Video Magnificationは映像中のヒトの目では捉えきれない微細な色/運動の変化を強調し、可視化する画像処理・合成技術である。しかし、この微細変化中には自然物理現象由来の意味のある微細変化と、撮像ノイズ由来の意味のない微細変化が混在している。本研究では、各々の微細変化の時間分布形状が異なる(拡散の仕方が異なる)ことに着目し、神経科学の分野で用いられる異方性比率という指標を以てそれらの違いを評価し、撮像ノイズに頑健な新しいVideo Magnificationを提案した。
【略歴】 2014年慶應義塾大学理工学部生命情報学科卒業。2016年同大学大学院基礎理工学専攻博士前期課程修了。2020年筑波大学大学院情報理工学位プログラム博士後期課程入学。2016年日本電信電話株式会社入社。専門は信号処理、神経科学、最適化。特に近年は、画像/音声処理・合成の研究に従事。第3回サイエンス・インカレ奨励表彰(2014年)、情報処理学会AVM優秀賞(2019年)、情報処理学会CGVI優秀研究発表賞(2019年)各受賞。