抄録
D-023
語の複数の共起関係と文章間の類似度を利用した災害情報抽出システムの提案
湯沢昭夫・市川博彬・小林亜樹(工学院大)
災害時において,災害の状況を把握する上で災害時の情報を収集することは重要である.
著者らは,1つの災害語のみから,災害語と共起する語集合と感動詞と共起する語集合を用いて,自動的に災害に関連する語を選別する手法を提案し,実際のツイートで判別を行い目的のツイートを抽出するシステムを構築した.
しかし,botなどの本文が重複したツイートによって,災害とは関係のない語の出現頻度が増えたため,災害とは関係のない語が選別された.
本稿では,cos類似度を用いて重複したツイートの1つの代表ツイートに集約することで,災害と関連しない語の出現頻度を抑え,災害と関連する語のみの抽出を試みる.
複数の災害の事例を用いて,妥当な手がかり語の抽出を検証する.