情報処理学会ホームページ
FIT2013第12回情報科学技術フォーラム 開催日:2013年9月4日(水)~6日(金) 会場:鳥取大学鳥取キャンパス
抄録
D-019
POI情報を利用したWeb文書からの地名の抽出
今井良太・廣嶋伸章・佐藤 隆・鷲崎誠司(NTT)
実世界の場所を示す表現には,住所や郵便番号等がある.これらは場所との対応付けが管理されている.一方で,周辺地域の人々の間でのみ通じる地名や,新たに呼ばれるようになった地名のような管理されていないものも,場所を示す表現として通用することがある.本稿では,このような地名を通称地名と呼ぶ.この通称地名を地理情報システムで扱うとき,新しい地名の出現のような時間による変化に追従するのは難しい.そこで本稿では,通称地名をWeb上の文書から効率的に抽出することを目的とする.具体的には,実世界の店舗やランドマークを指すPoint of Interest (POI)の情報を利用し,文書中の固有表現の中からより地名らしい文字列を抽出する.