6S-02
動画像処理ニューラルネットワークを用いた日本手話の単語認識
○安東芳高,川上 玲(東工大)
手話は聴覚障がい者にとって有用な対話の手段であるが、健聴者と手話で円滑に対話するには障壁があり、手話ツールの拡充が望まれる。海外の手話データセットは大規模化が進んでおり、日本でも日本手話データセットKoSignが公開されたところである。そこで本稿では、KoSignを用い、機械学習による日本手話の単語認識の精度を検証する。手話の動画を入力し、これを処理するニューラルネットワークをKoSignで微調整する。手話研究では、行動認識で事前学習する例は少ない。I3DとSlowFastの二種類のニューラルネットを適用し、I3Dでは62.51%、SlowFastで86.03%の分類精度を得た。