情報処理学会第85回全国大会 会期:2023年3月2日~4日 会場:電気通信大学

4M-04
深層強化学習による機会損失と破産確率を考慮した金融取引戦略の構築
○井上修一,穴田 一(東京都市大)
近年,機械学習の発展に伴い深層強化学習を用いた金融取引戦略を構築する研究が精力的に行われている.我々の従来研究では,取引エージェントの「買い」「売り」「様子見」といった行動に対し,相場の局面によって適応的に変化する機会損失を考慮した報酬を与えていた.しかし,取引の安全性については考慮されておらず,比較的大きな損失を出すタイミングがあった.そこで,本研究では取引エージェントの勝率,ペイオフレシオ,リスク資金比率から求められる破産確率を深層強化学習での状態変数や報酬に導入し,株式投資においてより安全に利益を上げるための最適な買いや売りのタイミングを学習するモデルを構築し,その有効性を示す.