7L-04
認知特性を実装した価値関数による非定常環境への適応
○甲野 佑,高橋達二(電機大)
捉えきれない形で変化する環境で実際に生きる人間は,上手く柔軟に情報収集とそのコストのバランスを取りつつ意思決定していると考えられる.そのような人間の傾向に習ったLoosely symmetric (LS)価値関数が存在する. LSは選択肢の評価に用いる事で,内的な基準とコストの釣り合いと選択肢に関する情報の信頼度を考慮して探索の打ち切りと再開を行う傾向(満足化)を意思決定に反映できる 本研究では基準を動的に変更して探索を柔軟に行える拡張型LS(LSX)を考案した.そして非定常多本腕バンディット問題を通して,非定常環境下で特殊な意思決定構造がなくともLSXが既存アルゴリズムより良く振舞う事を示す.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会