情報処理学会ホームページ
FIT2014 第13回情報科学技術フォーラム 開催日:2014年9月3日(水)~5日(金) 会場:筑波大学筑波キャンパス 一般社団法人電子情報通信学会 情報・システムソサイエティ 一般社団法人電子情報通信学会 ヒューマンコミュニケーショングループ 一般社団法人情報処理学会 筑波大学
抄録
F-028
複数種類の報酬と罰に対応した意識的意思決定システムの提案
宮崎和光(大学評価・学位授与機構)
意識とは何だろう?意識の定義は種々であり、意識とは、種々の概念が混在したスーツケースワードであるとの見方もある。本稿では、「素早い学習を行う部分」および「時間のかかる学習を行う部分」と「それらの間の調停を行う部分」の3 要素を有するシステムとして定義される「意識的意思決定システム」を提案する。著者らは、これまでに意識的意思決定システムの1 種と捉えることができるMarcoPoloを提案している。しかし、MarcoPolo は、マルコフ決定過程に限定された設計がなされており汎用性が乏しい。また、教師信号である報酬に関しても、最も単純な1 種類の報酬のみが存在する場合を想定している。そこで本稿では、複数種類の報酬と罰が存在するより一般的な環境における意識的意思決定システムの提案を行い、数値実験によりその有効性を確認する。