4ZB-01
合意形成に基づく機器制御における強化学習時間削減手法の提案
○永田大貴(岡山大),樽谷優弥(阪大),福島行信,横平徳美(岡山大)
複数のユーザの要望に沿った生活空間を実現する合意形成に基づく機器制御が提案されている.先行研究では,生活空間の環境と機器の制御パラメータからユーザの快適さを導出するユーザモデルを用い,強化学習によって機器の制御パラメータを決定する手法が提案されている.しかし,ユーザ数や制御対象機器数の増加に伴って行動空間が拡大し,学習時間も増大してしまうという課題があった.本研究では,強化学習時に考慮する制御パラメータの組み合わせ数を削減する手法によりこの課題の解決を行う.提案手法を用いた機器制御のシミュレーションを行った結果,学習時間を従来手法の33% 程度に短縮することに成功した