4Q-08
可変長N-gramに基づいたトピックへのラベル選択の検証
○慶留間諒大,當間愛晃,赤嶺有平,山田孝治,遠藤聡志(琉球大)
LDAなどのトピックモデルは情報検索や文書要約などの様々な分野で応用されている。
トピックモデルによって抽出されたトピックは単語とその生起確率のペアで表されており、解釈が困難な場合も少なくない。
トピックの解釈支援の研究の一つとして、トピックへラベルを付与する研究が行われている。
この分野では単語に重み付けを行ったり、文書中のN-gramからラベルを選定するといった研究が行われているが、これらの研究では対象とするラベルが固定長のみであるという問題点がある。
本研究では可変長のN-gramを抽出し、その中からラベルを選定する事でトピックの解釈を支援する事を目指す。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について