情報処理学会ホームページ
FIT2013第12回情報科学技術フォーラム 開催日:2013年9月4日(水)~6日(金) 会場:鳥取大学鳥取キャンパス
抄録
G-014
DVB強化学習を行うリカレントニューラルネットワークの構造獲得
齋藤成人・服部元信(山梨大)
人間のように多様に変化する実環境でも適切に行動できる知識をニューラルネットワークが獲得するためには、環境を自ら学習し、必要となる知識と機能を自律的に身につけるシステムが必要であると考えられる。また、複雑な環境に適応するには、時間情報を扱えることが望ましい。そこで、本研究では、遺伝的アルゴリズム(GA)に基づき、Direct-Vision-Based(DVB)強化学習を用いて、リカレントニューラルネットワーク(RNN)に時系列学習を要するタスクを自律的に学習させることを目的とする。RNNによって時系列による複雑な環境の変化を記憶し、GAによってタスクに適したRNN構造の自律的な獲得、RNN強化学習によって自律的なタスクの学習を行うことが期待できる。