6S-7
Webを利用したエンティティペア集合の代表的関係名抽出
○河崎 翔,ドゥク グェントアン,ダヌシカ ボレガラ,石塚 満(東大)
本研究では、ある意味関係を持っているエンティティペアの集合から、最も代表的な関係名の抽出が目的である。例えば,エンティティペア集合
{(Tokyo, Japan),(Paris, France), (London, UK)} から,最も特徴的なラベル
``capital'' を出力する.
提案手法では二段階の手順を踏む。
第一に、集合に属する各エンティティペアの代表的な関係名を抽出する。
その際、χ2検定を用いてスコアリングする。
第二に、全エンティティペアの最も代表的な関係名を一つ抽出する。
ここでは、先の段階で得られたスコアの線形和と学習によって得られる最適な重みを用いて全関係に対しスコアリングする。
ウェブコーパスで実験を行い、提案手法は高精度で関係名を抽出し、かつ既存手法よりも良い結果を得ることを示す。