2S-04
異分野テキストデータを対象とした同一単語の分野間における意味の差異抽出方式
本稿では,異分野テキストデータを対象とした同一単語の分野間における意味の差異抽出方式について示す.本方式は,分野ごとのコーパスを対象として,両コーパスのどちらにも含まれている単語のみを対象し,分野ごとのその単語に関する類似単語を比較することで,全く異なる意味で用いられている単語を抽出することが可能となる.本稿では,Wikipediaにおけるカテゴリを分野として捉え,生物学と情報学の2分野における同一単語における意味の違いの抽出を実現した.本方式は,同じ単語であっても別の意味で用いられる場合をあらかじめ把握でき,コミュニケーションギャップを防ぐことが可能になる.