2S-2
文書内のイベントを対象にした潜在的トピック抽出手法の提案
○北島理沙,小林一郎(お茶の水女子大)
近年,文書内に存在する複数のトピックを推定する手法として,LSI,pLSI,LDA と
いった潜在的意味解析手法が利用されている.しかし,これらの手法において,トピ
ックは個々の単語に割り当てられ,文書の内容を捉える語の関係について考慮されて
いないという問題がある.そこで本稿では,文の係り受け関係から抽出される語の関
係を「イベント」という単位で取り扱い,トピックの割り当て対象を,従来の「単語」
から「イベント」に変更した潜在的意味解析手法を提案する.潜在的意味解析手法と
しては,LDA を用い,文書分類タスクによって提案手法の有効性を示すと共にトピッ
クの内容が容易に把握できるようになることを示す.