5X-5
Cassandraを用いた並列分散処理機構の開発とHadoop Cassandraとの比較
○菱沼直子(お茶の水女子大),竹房あつ子,中田秀基(産総研),小口正人(お茶の水女子大)
近年,大量のデータを高速に処理することが必要な場面が増え,分散KVS が注目され始めた.分散KVSを用いると,RDBMSでは管理が困難な大容量データを分散環境で管理することができる.分散KVSで管理されている大容量データを高速に処理するには,データを複数の計算機で並列に処理する必要がある.しかしながら,分散KVSから対象データを取り出した後,再度データを分散させて並列処理を行うと,データの転送遅延により処理効率が悪くなってしまう.我々は,大容量データを扱う分散KVSであるApache Cassandraに着目し,大容量データをより高速に処理するために,データアフィニティを考慮した並列分散処理を提案し,実装している.本稿では,本実装の特性を明確にするため、提案手法とApache Cassandraの Hadoop連携機能との性能比較を行う.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について