情報処理学会第79回全国大会講演論文集

5M-09

転移学習によるDeep Q-Networkの学習高速化に向けた検討

○足立一樹，佐々木勇人，中田雅也，濱津文哉，濱上知樹（横浜国大）

Q-Learningに深層学習を取り入れた手法であるDeep Q-Network（DQN）には，従来のQ-Learningでは扱いきれない画像のような高次元の観測を直接扱うことができるという利点がある。しかし，課題として学習には膨大な回数のエピソードを繰り返す必要がある。この課題に対処するために，別のタスクで学習済みの畳み込みニューラルネットワーク（CNN）を利用した転移学習が行われている。転移学習によりエージェントはタスクに有用な特徴抽出を行える状態から学習を開始できると考えられる。本稿では転移を行うCNNの層数を変化させ，学習回数や得られる報酬にどのような影響が現れるかを実験により調査する。

情報処理学会 第79回全国大会講演要旨

情報処理学会第79回全国大会講演要旨