6M-1
BM25を用いた関連語抽出と単語分類
○吉岡康平,小枝正直(大阪電通大)
人工知能にとって,単語の意味を理解させることは重要なタスクの一つである.
しかし,現存する単語の数は膨大であり,それらを人手で分類し,学習させることは非現実的である.
また,日々生まれる新語への対応も困難である.
そこで本論文では,単語の意味を単語が属するシソーラスノードから獲得できる点に着目し,
Web情報のみを用いた任意単語の関連語抽出とカテゴリへの分類手法について述べる.
具体的には,Open Directory Projectのカテゴリを木構造のシソーラスと見立てて任意単語の関連語を抽出し,
その単語をOpen Directory Projectの適切なカテゴリに分類する.