1N-5
木構造類似度算出法のための複数観点の抽出法
○池田健人,波多野賢治(同志社大)
近年,大量に存在するデータの中からユーザの求めるデータを的確
に見つけ出すための類似度算出法が必要となってきている.その中
でも XML をはじめとする木構造データが様々なデータで用いられ
てきている.我々は木構造データに注目し,その類似度算出法の考
案を行う.既存の木構造類似度算出法では,類似度を算出する際に
木構造に対して一つ観点からしか捉えていないため,我々の既存研
究では木構造データからの複数観点を用いた類似度算出法を提案し
てきた.しかし,その観点間に相関が残っており,冗長な観点の選
択となっていた.本稿では抽出可能な複数の観点の中から,木構造
データの特徴を表す事が可能な観点を主成分分析や回帰分析を用い
た抽出を行い,その観点を用いた木構造類似度算出法の提案を行う.