情報処理学会ホームページ
FIT2013第12回情報科学技術フォーラム 開催日:2013年9月4日(水)~6日(金) 会場:鳥取大学鳥取キャンパス
抄録
E-016
Earth Mover's Distanceを用いた同音異義語判別
河原直人・梅澤 猛・大澤範高(千葉大)
日本語の仮名漢字変換における入力誤りの一種として同音異義語誤りがある。文章に出現した同音異義語がその文脈に適した漢字文字列であるか特定する同音異義語判別ができれば、入力誤りの訂正に応用できる。そこで本研究では、文書内に出現する単語や品詞の局所的および大域的な情報の分析による、文脈に則した同音異義語の特定を検討する。局所的情報と大域的情報を統一的に扱うためにEarth Mover's Distance (EMD)を用いる。EMDを算出するための特徴量や重み、単語間のコストを提案し、EMDに基づく同音異義語判別に対する有効性を評価する。