情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

1W-02
ハウスホルダーフローを導入したEmbedded Topic Modelに関する一考察
○松苗亮汰,山極綾子,後藤正幸(早大)
トピックモデルは,単語をその共起関係からモデル化し,自動で文書のトピックを抽出可能な機械学習モデルである.Embedded Topic Model(ETM)はトピックモデルの一つであり,深層学習を用いてトピックと単語を同一空間上にEmbeddingする.ここで,文書ごとにトピック間に相関が存在すると考えられるが,ETMはトピック分布の推定時に各トピックが独立と仮定している.そこで本研究では,ETMのトピック割合に対してハウスホルダーフローを適用することで,トピック間の相関を表現可能にしたFlow-ETMを提案する.Flow-ETMは従来のETMよりも,より柔軟に入力文書に沿うトピック分布の生成が期待される.最後に文書データセットを用いた評価実験により,提案手法の有効性を確認した.