7B-04
医学生物学文献からの数値情報抽出における教師データ削減の検討
○大瀧洋子,木戸邦彦,加藤千昭(日立),久保田一石,安松 勲(第一三共RDノバーレ)
医学生物学文献に記載されている数値情報は、定量的かつ客観的な情報であるため情報としての価値が高い。数値と属性名の対で表現される数値情報を、機械学習によって高精度で抽出する技術の開発を目的とし、従来の課題であった教師データ収集コストの削減手法について検討を加えた。本研究では、「化合物と標的タンパク質の活性予測に関係する数値情報」の収集を対象とし、能動学習によって効果的に教師データを選択する手法を用いることによる教師データの削減効果を評価した。数値情報の抽出精度F値を80%に保つ条件のもとで、教師データの収集件数を従来よりも84.0%削減することができた。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会