情報処理学会 第88回全国大会

7ZC-07
Atariにおける強化学習に対する物体アノテーションの効果
○土倉正喜,本多泰理,中村周吾,佐野 崇(東洋大)
画像を状態として受け取る強化学習モデルは、物体に対する適切なアノテーションを用いることでより効率的な学習が可能になると考えられる。
本研究では Atari を環境として、画像と物体アノテーションの強化学習への影響を調べた。
単純に画像とアノテーションの特徴を結合した場合と、画像とアノテーションを異なるチャンネルに配置した場合を比較すると、後者の方がより効率的な学習が可能であった。
これは、アノテーションを別チャンネルに分けることで、元の画像の情報を損なわずに活用することができたからだと考えられ、アノテーション統合の設計の重要性を表している。