FIT2019 第18回情報科学技術フォーラム

抄録

CF-004
非通信マルチエージェント強化学習における獲得報酬値の変動を用いたエージェント数の動的変化への追従

◎上野　史・髙玉圭樹（電通大）

マルチエージェント強化学習は，問題を複数エージェントによってモデル化したシステムを協調的に振舞わせるための学習方法である．しかし実問題のように動的変化する環境では協調的振舞いは変化し，適切に学習することは困難である．本研究は，動的変化の中でもエージェント数の動的変化に着目し，通信を行わずにその動的変化に追従した協調行動を学習する手法を提案する．エージェント数が変化すればシステム上の全エージェントの振舞が変化し，各エージェントの学習の手がかりである報酬の獲得量も変化する．そこで，本研究では学習毎の獲得報酬値の変動を観測し，その変動に追従して学習することでエージェントの数の動的変化に追従する．

A	モデル・アルゴリズム・プログラミング
B	ソフトウェア
C	ハードウェア・アーキテクチャ
D	データベース
E	自然言語・音声・音楽
F	人工知能・ゲーム
G	生体情報科学
H	画像認識・メディア理解
I	グラフィクス・画像
J	ヒューマンコミュニケーション＆インタラクション
K	教育工学・福祉工学・マルチメディア応用
L	ネットワーク・セキュリティ
M	ユビキタス・モバイルコンピューティング
N	教育・人文科学
O	情報システム