抄録
F-017
社会インフラシステムの稼動データ流通のためのバイナリハッシングによる近似クラスタリング
◎但馬慶行・望月智之・志村明俊・武澤隆之(日立)
鉄道・電力等の社会インフラシステムでは、機器や計算機の稼動データを高度な保守等に活用する新サービスが期待されている。こうしたサービスでは収集される大量のリアルタイムデータをサービスに適した形に要約する必要がある。しばしば要約にはクラスター分析を用いるが、その計算量は大きな問題となる。そこで本研究では社会インフラシステムの構成を踏まえたクラスター分析の高速化手法を提案する。本手法は、収集時に元の距離を保存するバイナリハッシュを算出し、分析時にそのハミング距離が大きい箇所の距離計算を近似する。実験の結果、半分程度近似した場合でもある程度性能が維持できることを確認した。これにより計算量を削減できる。