4U-03
k-meansのための初期値外れ値を考慮した初期値設定手法の提案
○田口隼平,西垣貴央,小野田崇(青学大)
KKZは観測されたデータの中で最も離れたデータ同士をk-meansの初期値とする方法である。最も離れたデータ同士を初期値とすることで、生成されるクラスタのクラスタ間分散が大きくなることを期待できる。しかし、KKZが初期値としての外れ値を選択した場合、生成されたクラスタのクラスタ内分散が大きくなってしまう。本報告ではこの問題を解決する方法を提案する。提案手法はMT法の考えを用いて、全データの平均からのマハラノビス距離が4か9を超えたデータを初期値から避けてKKZを行う。提案手法の有効性を検証するために、複数のデータに提案手法を適用し、従来の初期値選択手法との比較を行う。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会