1D-2
評価表現の自動抽出とテキストマイニングシステムSTMへの組み込み
○原田 実,泉 祥太,関谷瑠紀(青学大)
本研究はテキストマイニングに用いる評価表現を抽出するための高精度な辞書を構築。
Webから取得したレビュー文などをSAGEを用いて意味解析をした後に、評価表現が現れるであろう「述部・対象・属性」の3つ組を評価表現候補として抽出ルールを用いて抽出する。
webより取得した“評価表現辞書”をベースに概念化と評価極性を付与した“カーネル辞書”を作成し、評価表現候補の絞り込みを行う。
絞り込まれた候補に対して人手で極性のラベル付けを行い、さらに述部・対象・属性などの上位概念やモダリティなどを素性にして、学習機を用いて学習し、この結果を用いて評価表現抽出システムを作成した。