FIT2016 第15回情報科学技術フォーラム 開催日:2016年9月7日(水)~9日(金) 会場:富山大学キャンパス
抄録
E-004
英語Wikipediaリンクデータの利用による日本語wikification
村上凌悠・綱川隆司・西田昌史・西村雅史(静岡大)
 Wikipediaは様々な分野をカバーする大規模百科事典である。ある文章中の語句からその語句を説明するwikificationの実現により、効率的に記事の内容を理解するための内部リンクを自動的に付与できる。
Wikificationにおけるリンク先決定法として、リンクが張られる語句の曖昧性解消問題を機械学習により解決する方法がある。機械学習のトレーニングデータとして日本語Wikipediaのリンクデータが用いられるが、対象とする語句によっては十分なデータ量が得られないといった問題がある。
 本研究では機械学習による日本語wikificationに英語Wikipediaリンクデータを追加する方法を提案し、比較実験によりwikificationへの影響を分析することで、他言語版である英語Wikipeidaリンクデータの有効性を考察する。