情報処理学会第74回全国大会講演要旨

2D-7

ファジィ制御ルールにより表現された方策を持つ方策勾配法の提案

○五十嵐治一（芝浦工大），石原聖司（近畿大）

方策勾配法は強化学習の一種であるが，方策の記述に関してかなり
の柔軟性がある．本研究では，方策としてファジィ制御ルールによ
る記述を可能にした方策勾配法の手法を提案する．本手法において
は，行動選択のためのif-thenルールの前件部／後件部のメンバシ
ップ関数の値とルールの重み値は，エピソードあたりの期待報酬を
極大化するように学習することができる．今回は，これらの値をパ
ラメータとする具体的な学習則の導出と，得られた学習則の意味を
述べる．

情報処理学会 第74回全国大会講演要旨

情報処理学会第74回全国大会講演要旨