5T-01
ランダムな試行の学習によって構成された15パズルの評価関数について
○伊藤康太,山本修身(名城大)
15パズルなどのスライディングパズルの評価関数は,通常そのパズルの構造に基づいて構成される.これに対して本稿で示す15パズルの評価関数は,実際にゴール状態からスタートしてそのパターンを崩していくことで得られるパターン列を利用して構成される.提案手法では,この列を教師データとして学習させたニューラルネットワーク(NN)を構成し,さらに15パズルを崩す過程で頻繁に出現するパターンを見つけ出しそこからランダムに探索することで,よりよい教師データが得た。このような手法によりマンハッタン距離和関数に比べて探索ノード数が4,200倍程度効率的な評価関数が得られた.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会