情報処理学会第85回全国大会 会期:2023年3月2日~4日 会場:電気通信大学

5U-09
サプライチェーンにおける自動交渉のためのエンべディングを用いた強化学習フレームワーク
○宮島龍冴,藤田桂英(農工大)
本論文では,サプライチェーンにおける取引に関する自動交渉において,交渉相手の戦略モデルを考慮した交渉戦略を学習するための強化学習フレームワークを提案する.
交渉相手の戦略のモデリングは,Generative-Discriminative Representationを目的として交渉データから教師なし学習した表現関数によるエンべディングにより実現する.
評価実験により,表現関数が交渉戦略を区別するために有効なエンべディングを行えており,提案した強化学習フレームワークが並列交渉において相手毎に自らの選好を最大にする戦略が学習できることを示す.