1H-04
データのアクセス頻度に着目したHadoop分散ファイルシステムの性能向上
○山本 景,川原 純,笠原正治(奈良先端大)
Apache Hadoopは分散処理プラットフォームとして広く普及しており,処理速度の高速化が急務である.Hadoopでは,分散ファイルシステムであるHDFSにより複数のノードでデータの保存,管理を行っている.HDFSでは,ファイルの分散配置先が処理速度に大きく影響することが先行研究で明らかにされている.本研究では,HDFSにおける複製データの配置法の改良により,HDFSの処理性能の改善を図る.データのアクセス頻度が既知であるという仮定の下で,アクセス頻度の高いデータを多くのラックに配置する手法を提案する.モンテカルロシミュレーションにより分散処理性能が改善されることを示す.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会