6K-7
LZ78符号による正規化圧縮距離の性能解析
○遊佐俊彦(東工大)
データの類似度を測る指標として,Kolmogorov記述量をもとにした,正規化情報距離(NID)というものがある.
しかし,Kolmogorov記述量は計算不可能なため,その代用として,圧縮列の長さを用いた,正規化圧縮距離(NCD)があり,実験により音楽ファイルや遺伝子情報を分類している.
本稿では,圧縮アルゴリズムとして,LZ78符号を用いたときの,正規化圧縮距離(NCD)の妥当性を検討する.