2B-02
運用で使われているファイルサーバボリュームのデータ重複率の測定と評価
○荻原一隆(富士通研)
ストレージ装置のハードウェア故障時の対応だけでなく、ユーザの操作ミスによるデータ消失に備えるためにもデータのバックアップは重要であり、1日あるいはもっと短い間隔でバックアップを取ることは必須要件となりつつある。
並行して、ファイル数やファイルサイズの増大によりバックアップ対象のデータが増え、それに伴い 、バックアップの処理時間や格納すべきデータ量も増えている。後者については重複除去技術を用いることでデバイスに格納するデータ量を削減できる。
今回は、実際に使用されているファイルサーバのボリュームを対象に3種類のチャンキングで重複除去の効果のベースとなるデータ重複率を測定した。その測定結果および結果に基づく考察を報告する。