情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス 情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス

5U-01
POMDPs環境のためのDeep Q-Network
○西川未来,長名優子(東京工科大)
本研究では、 POMDPs環境のための決定的政策を学習する Deep
Q-Networkを提案する。提案手法は、入力として用いる観測の長さの
異なる複数の Deep Q-Networkを用いる手法であり、観測ごとの行動
の決定度と学習の進行度を用いて不完全知覚状態の判断を行い、不
完全知覚状態であると判断された場合には、より多くのステップに
おける観測を入力として扱えるようなネットワークに切り替え、
その出力によって行動選択を行うようにすることで、適切な行動が
選択できるようにする。