4S-3
WordNetを用いた機械学習による談話構造解析
○伊藤直貴,Hugo Hernault,石塚 満(東大)
これまでに,談話構造解析の手法として,コーパスによる機械学習を用いた手法が提案されている.既存手法の多くは,2文から得られるワードペアを素性としているが,無作為に全てのワードペアを利用することは冗長であり,特に機械学習を利用する場合,分類時の計算コストの増大および過学習の原因となる可能性がある.
そのため我々は,WordNetを利用した単語同士の類似度の指標を,機械学習による談話構造解析に用いることを提案する.本手法は,素性選択の際に,出現する単語が意味する概念間の類似度や上位・下位関係をWordNetから取得する.これらの情報を用いることで,談話構造の決定に有効な単語を抽出することが可能であると考えられる.