情報処理学会第83回全国大会講演論文集

1Q-02

生存行動再現に関する強化学習アルゴリズムの考察

○西垣祐紀，河野敏行（岡山理大）

本研究では，生物を取り巻く単純な三次元の環境を用意し，その環境下で生物が生存のために行う捕食行動と外敵から逃げる退避行動を強化学習アルゴリズムによって獲得するかどうかの考察を行う
環境はUnreal Engineで作成を行い，強化学習アルゴリズムとしてDQNを拡張したNormalized Advantage FunctionやRecurrent Experience ReplayなどをTensorFlowによって作成を行った．