2C-02
データの構文的かつ意味的解釈によるスキーママッチング手法の提案
○姜 逸越(富士通研)
データ分析の際にデータ前処理に費やす時間は作業全体の8割を占め、その時間短縮が望まれる。データ準備の一つにデータ統合があり、特に、異なる名前で定義されたスキーマの統合を支援する技術をスキーママッチングという。テーブルデータのような構造化データの場合、スキーマは属性の集合であり、スキーママッチングはこの集合の中にある複数の属性それぞれを識別し適切なマッチングを行う。従来手法として、各スキーマの構成要素とする属性名のマッピング、データの中身の構文的な解釈のみを基準とした類似度比較による方法が知られる。本研究では、データの中身の構文的および意味的な特徴を考慮するスキーママッチング手法を提案する。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会