4D-6
ブートストラッピング手法を用いた句表現の自動抽出
○野村雄司,末永高志,高木 徹(NTTデータ)
テキストマイニングや文書検索において、ある特定の意味を持った
表現を抽出することで、意味を考慮した分析や絞り込みに適用する
要求が高まっている。
これまで人名や組織名、製品名など特定の単語を抽出する検討は
多く行われているが、本検討では動詞を含むような、ある特定の
意味を持つ句表現を抽出する手法を提案する。
様々な種類の文書に対して、少ない作業コストで抽出できるよう、
少数の正解データから抽出可能なブートストラッピング手法を
ベースとし、句表現を抽出するための拡張を行った。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について