FIT2015第14回情報科学技術フォーラム 開催日:2015年9月15日(火)~17日(木) 会場:愛媛大学城北キャンパス
抄録
E-020
分割誤りに頑健な新語のカテゴリ分類
山田達史・松本和幸・吉田 稔・北 研二(徳島大)
近年Twitterなどインターネット上の書き込み回数が飛躍的に増加している.tweetには,流行の言葉が多く含まれるため,既存のシソーラスで直接カテゴリ分類をすることは困難である.また,単語の文脈に基づく既存の単語意味解析の手法では形態素解析による分かち書き処理が前提となる.たとえば新語である“大阪都構想”という単語は形態素解析では“大阪/都/構想”と分割されるため解析することはできない.本研究では,シソーラスで分類されていない語を新語として定義し,分割誤りとなる新語でもカテゴリを付与できる手法を提案する.