1Q-02
生存行動再現に関する強化学習アルゴリズムの考察
本研究では,生物を取り巻く単純な三次元の環境を用意し,その環境下で生物が生存のために行う捕食行動と外敵から逃げる退避行動を強化学習アルゴリズムによって獲得するかどうかの考察を行う
環境はUnreal Engineで作成を行い,強化学習アルゴリズムとしてDQNを拡張したNormalized Advantage FunctionやRecurrent Experience ReplayなどをTensorFlowによって作成を行った.
環境はUnreal Engineで作成を行い,強化学習アルゴリズムとしてDQNを拡張したNormalized Advantage FunctionやRecurrent Experience ReplayなどをTensorFlowによって作成を行った.