6B-4
学習データ量によるスキーママッチング精度向上効果評価報告
○小出健太,柴 光輝,谷垣宏一,高山茂伸(三菱)
システム間データ統合の省力化のため、データベース項目の対応関係を
自動推定するスキーママッチング方式を開発した。
本方式は、マッチングする項目の単語重複やレーベンシュタイン距離といった、
複数の手法からの特徴量をベイジアンネットワークによって重み付けし、
項目間の類似度を算出する。学習データとしては、過去に対応付けた項目を利用する。
本論文では、本方式実用化に向け、学習に必要なデータ量の評価について述べる。