情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス 情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス

7T-06
単語の出現頻度に基づくテキストの話題分割とラベリング
○柿本雄輝(名工大),毛利元昭(愛知大),打矢隆弘,船瀬新王,内匠 逸(名工大)
現在,ブログやSNSなど情報の発信が容易になったことに伴い,文書データは日々蓄積されている.文書データが膨大であっても,話題抽出が適切に行われていれば,検索を容易にすることができる.また,テキストマイニング技術によって文書の構成を把握できれば,文書全体を読むことなく必要な部分のみを確認することも可能となる.文書の話題抽出を行う方法として,複数の文書間で比較し,話題に特有な単語を判別する手法が挙げられる.しかし,単一の文書の話題分析には用いることができない.そこで,単一の文書から得られる情報を用いた話題の抽出と推移を確認する.本稿では,文書内の単語の出現傾向に着目し,話題の推移の可視化を行う.