7D-01
マルチエージェント強化学習による交通信号機制御に向けて
○岡野拓哉(筑波大/産総研),野田五十樹(産総研),大西正輝(筑波大/産総研)
複数の交通信号機を単体の強化学習によって
制御しようとした場合、
制御対象の交通信号機の数が増加するにつれて
状態空間、行動空間も膨大となり、
最適制御方策を学習することは困難である。
そこで、本研究では、
各強化学習エージェントが各信号機を制御する
マルチエージェント強化学習を用いて、
複数の交通信号機を制御することを試みる。
格子状のマップを用いて、
実験的にマルチエージェント強化学習による
交通信号機制御の評価を行う。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会