2D-7
ファジィ制御ルールにより表現された方策を持つ方策勾配法の提案
○五十嵐治一(芝浦工大),石原聖司(近畿大)
方策勾配法は強化学習の一種であるが,方策の記述に関してかなり
の柔軟性がある.本研究では,方策としてファジィ制御ルールによ
る記述を可能にした方策勾配法の手法を提案する.本手法において
は,行動選択のためのif-thenルールの前件部/後件部のメンバシ
ップ関数の値とルールの重み値は,エピソードあたりの期待報酬を
極大化するように学習することができる.今回は,これらの値をパ
ラメータとする具体的な学習則の導出と,得られた学習則の意味を
述べる.