抄録
F-039
数値を含むデータからの効率的な識別パターン発見に向けて
亀谷由隆(名城大)
識別パターン発見は興味の対象のクラスとその他の違いを特徴づけるパターンを見つけ出すタスクであり,顕在パターン発見やサブグループ発見とも呼ばれる.また,得られた識別パターンを利用することで高精度の予測モデルを構築することもできる.識別パターン発見における一つの大きな問題は数値データの扱いである.教師付き離散化手法は単属性に基づくものが多い.また,探索空間も非常に大きくなる.本論文では,数値データと記号データが混在したトランザクションデータに対してFP-growthに基づく識別パターン発見手法を提案する.そして,提案手法のプロトタイプ実装をベンチマークデータセットに適用した結果を示す.