3R-06
深層強化学習エージェントの自己モデルによる意図の解釈
○福地庸介,大澤正彦,岨野太一(慶大),山川 宏(ドワンゴ),今井倫太(慶大)
エージェントが他者と協調して行動するためには、互いの意図の推定、理解が不可欠である。しかし深層強化学習器による意思決定の過程は他者からブラックボックスとなるため、他者はエージェントの入出力情報のみからエージェントの意図を推定するという困難な問題に直面する。一方他者理解においては、互いの内部状態の共有が重要という考え方がある。そこで本研究では、深層強化学習器の行動決定に対し、自身の意図を解釈する自己モデルを構築する。この際他者からのメッセージをベースにすることで、他者と自身の内部モデルが部分的に共有される。また熟練者が自身の行動と整合性のある意図を表出できれば、それは他者にとって有効な戦略になると考える。そこで生成された意図が他エージェントの学習を促進することをもって、自己モデルを評価する。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会