FIT2016 第15回情報科学技術フォーラム 開催日:2016年9月7日(水)~9日(金) 会場:富山大学キャンパス
抄録
E-005
Wikificationにおける前接語・後接語を用いたアンカー抽出
小谷亮太・綱川隆司・西田昌史・西村雅史(静岡大)
 一般の文書からWikipedia記事を容易に参照できるようにするため、Wikipedia記事に自動的にリンクを張るwikificationという手法が注目されている。
 Wikificationは、リンクを貼るべき語句(アンカー)を抽出するステップと抽出したアンカーのリンク先記事を決定するステップから成っている。後者は語義曖昧性解消の問題であり、様々な手法が試みられているが前者の研究はこれに比べると少ない。あらかじめアンカーを決定したのち、曖昧性解消に焦点を当てた研究が多い。そこで、文書中の重要な語句や当該文書の読者が十分な知識をもっていないような事項を表す語句をアンカーとして抽出する方法が必要である。
 本稿は、SVMを用いたアンカー抽出に関し、前接語・後接語を含む有効ないくつかの素性を提案し、既存研究と比較評価した結果を報告する。