情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

5G-04
バンディット問題による主観的リターンの観測可能性について
○仲里慎司,下川哲矢(東理大)
選択における利得の追求と探索のバランスは、Multi-Armed Bandit問題として定式化され、近年、これらの成果を人間行動へ応用する潮流がある。とりわけGaussian ProcessとUpper Confidence Bound方策を採用したものは、人間行動モデルとしても有効であることが実証されてきている。しかしながら、この行動モデルを現実の問題に応用する際、主体が選択から得たリターンは、観測者には一般に手に入らないといったボトルネックが存在する。本研究では、このような観測不可能な主観的リターンを、選択の極限分布を用いて顕示する手法を提案し、その有効性を、マーケティングデータを用いて実証した。また同時に、このような行動モデルの妥当性を、視線情報等生体データも用いて検証した。