情報処理学会 第86回全国大会 会期:2024年3月15日~17日

7K-03
効率的に更新可能な多次元学習型索引
○日髙楓雅,松井勇佑(東大)
多次元学習型索引とは、機械学習モデルを用いてデータ分布を学習することにより、多次元直交領域検索クエリに古典的データ構造よりも高速に答えることができるデータ構造である。既存の多次元学習型索引の問題点として、データ構造に格納されているデータの分布が歪むと大きく検索性能が低下する点が挙げられる。我々は、データの更新操作によりデータ分布が歪んだ際に多次元学習型索引の内部構造を部分的に再構築し、検索性能の低下を回避するアルゴリズムを提案した。人工データや実世界データを用いた実験により、提案方式は多くのケースで性能低下を抑えられていることと、厳密に計算量が保証された平衡kD木より高速であることが示された。