6W-02
言語的知識の活用による物体検出システムのクラス予測性能の改善
○河西兵磨,松田源立(成蹊大)
物体検出とは画像内に存在する物体のクラスとその位置を予測する技術であり、予測対象のクラス数が増加するほど性能が悪化する傾向にある。従来の物体検出モデルでは画像情報のみを基に予測しているが、本研究では、物体に対する言語的知識も活用しクラス予測の性能向上を目指す。具体的には、物体検出モデルYOLOv3の検出結果に言語的知識から得たクラス間の類似度を加算し、物体の再検出を行う。言語的知識については、skip-gramモデルによってベクトル化された単語データ、言語概念辞書wordnetから求められた単語間の距離を利用した。そしてMS COCOデータセットを用いて従来手法と性能を比較し、提案手法の有効性を検証した。