抄録
E-006
ユーザフィードバックによる固有表現抽出の精度改善
加藤大羽・田中美智子(日立)
近年,企業内に蓄積されたダークデータを活用する取り組みが注目されてきている。しかしこの取り組みは人手で行うと,膨大な工数がかかり迅速にビジネス適用できない。我々は,テキストデータとユーザから入力された少ない業務知識を教師データとして,弱教師学習により膨大な文書から半自動的に固有表現抽出するツールを開発している。本報告では,データ分析スキルに依存せず精度改善が可能な正誤情報フィードバック機能を提案し,課題解決事例集からの固有表現抽出に適用し,精度評価を行った。フィードバック適用前はF値0.5に対し, 4%のみ正誤判定することでF値を0.8に向上することを確認した。