抄録
E-011
表記ゆれの補正と雑音除去による新聞から構築した概念ベースの精錬
山口周平・岸本達也・土屋誠司・渡部広一(同志社大)
機械と人が円滑なコミュニケーションを行うためには人間が持つある語から別の語を連想する機能が必要であると考えられる.この機能を実現するためにある語を概念と定義し,属性と重みの対の集合で表現している概念ベースが存在する.しかし,この概念ベースは辞書が情報源であったため,流行語や時事用語などが含まれていなかった。一方で,新聞記事を情報源とし共起を用いて,流行語や時事用語を保持した概念ベースを構築する手法が提案されている.しかし,この手法で構築された概念ベースでは表記ゆれや雑音が考慮されていなかった.そこで,本稿では辞書を用いた表記ゆれの補正およびidfを用いた概念の属性の除去を行った.