1C-3
ドメイン知識を用いた異名義RDFエンティティの同一性推定手法の検討
○森田大翼,飯塚京士,村山隆彦,赤埴淳一(NTT)
企業内には多様な情報が埋れている.近年,それらを統合して分析し,企業戦略に役立てるニーズが高まっている.
そのようなデータ連携において重要な課題は,複数のデータ資源をまたいだデータの同一性推定である.
本稿では特に,異名義の同一データの連携に着目する.
例えば,ある研究・企画プロジェクトと,その開発・製品化プロジェクトが別名で管理されていても,プロジェクト間の同一性を推定し,その製品の詳細な技術を持つ人への到達を可能にする.
本稿ではその例題として,RDFにより表現されたデータの集合における異名義データ間の同一性推定の問題に取り組む.
各対象データの周辺情報に加え,特定ドメインの知識を利用することで,この問題の解決の可能性を示した.