3B-04
文字列クラスタリングのための Laplace 様混合モデルに対する EM アルゴリズム
○小谷野仁,林田守広(京大)
近年、テキストデータや生物配列など、生成される文字列データの量が飛躍的
に増加し、文字列データの解析法が様々な領域で求められている。本研究にお
いて、我々は、混合モデルと EM アルゴリズムを用いた、文字列データの教師
無し多クラス分類に取り組んだ。まず、与えられたアルファベット上の文字列
の全体がなす位相半群上に Laplace 分布のアナロジーを導入して、その基本的
な性質を明らかにし、位置と散らばりのパラメーターの最尤推定量を構成して、
その漸近的性質を調べた。これらの準備の後、導入した分布の混合モデルに対
する EM アルゴリズムを構成し、漸近理論の枠組みでその精度を研究した。ま
た、提案したアルゴリズムの精度を数値実験によって定量的に検討した。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について