情報処理学会第79回全国大会講演論文集

3R-06

深層強化学習エージェントの自己モデルによる意図の解釈

○福地庸介，大澤正彦，岨野太一（慶大），山川　宏（ドワンゴ），今井倫太（慶大）

エージェントが他者と協調して行動するためには、互いの意図の推定、理解が不可欠である。しかし深層強化学習器による意思決定の過程は他者からブラックボックスとなるため、他者はエージェントの入出力情報のみからエージェントの意図を推定するという困難な問題に直面する。一方他者理解においては、互いの内部状態の共有が重要という考え方がある。そこで本研究では、深層強化学習器の行動決定に対し、自身の意図を解釈する自己モデルを構築する。この際他者からのメッセージをベースにすることで、他者と自身の内部モデルが部分的に共有される。また熟練者が自身の行動と整合性のある意図を表出できれば、それは他者にとって有効な戦略になると考える。そこで生成された意図が他エージェントの学習を促進することをもって、自己モデルを評価する。

情報処理学会 第79回全国大会講演要旨

情報処理学会第79回全国大会講演要旨