抄録
D-004
多観点類似度を用いた凝集型階層クラスタリング
藤原勇二・古賀久志・戸田貴久(電通大)
一般的に高次元ベクトル間の類似度にはコサイン類似度が用いられる。Nguyenらはベクトルの原点を入力データの一部とする多観点類似度を提案し、非階層クラスタリングに適用した。しかし、非階層クラスタリングは事前にクラスタの数の指定が必要である。そこで本研究では、クラスタ数の指定が不要で階層的な分類構造を抽出できる階層クラスタリングに多観点類似度を適用した。多観点類似度を用いる場合、観点数に従って計算量が増加することが懸念されるが、本研究では計算量を増加させずに階層クラスタリングを実現することに成功した。また、実験により文書データの分類精度が既存手法より上回ることを確認した。