抄録
E-021
統計指標を用いた日本語コーパスからのコロケーション情報抽出と精度評価
園田 匠・島田 諭・三浦孝夫(法大)
自然言語処理の目的の一つに,コロケーション情報の分析がある.
コロケーション情報を獲得することで語用の実態の把握や,言語の働きの詳細部の解明等が可能となる.
コロケーション情報の抽出には統計指標を用いるが,どの指標が抽出に優れているか,具体的な抽出精度はどれほどであるかについてはあまり明らかではない.
本研究ではデータマイニング手法,並びにいくつかの統計指標を用いて大量のコーパスからの日本語コロケーション情報抽出を検討する.
また抽出結果をコロケーション辞典と比較し、その精度を評価する.