4P-06
マルチエージェント強化学習における進化的探査率調整法とその拡張
○岡野拓哉,野田五十樹(東工大)
マルチエージェント強化学習の探査率について、進化的アルゴリズムをベースとした調整法と、その欠点を補う手法を提案し、実験により検証を行う。

探査率はマルチエージェント強化学習において学習速度及び精度を左右する重要なパラメータである。
しかし、この探査率の調整法は未だ確立していない。
本研究では、動的に変化する資源共有問題を題材とし、その均等分配を学習で達成すべき最適状態と定義し、それを迅速に達成できる探査率を全体最適値とみなす。
一方、探査率を進化的手法で修正する方法を構成し、全体最適との関係を調べる。
さらにその結果に基づき、全体最適に近い探査率を発見できる手法を構成していく。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会