2012-04-30 15 views
2

大量のデータに対応するシステムを設計する予定です。運用開始当初は、限られた予算で小規模なデータセットを扱うことができるため、小規模なデータセットでもうまく動作する必要があります。Cassandraは単一ノードクラスタ上のHBaseより高速ですか?

私が知る限り、HBaseは小さなデータセットではうまく機能せず、少なくとも5ノードのクラスタが必要です。しかし、この構成は現時点では高価です。私は、HBaseとCassandraの両方が大規模なデータセットに適したソリューションであることを知っています。しかし、小さなデータセットを持つ単一のノードでCassandraの方が高速ですか?

私は、すべてのノードがP2Pシステムに基づいて同一であるため、Cassandraは小さなデータセットで問題がないと仮定します。これは正しいです?

答えて

3

Cassandraとhbaseのパフォーマンスの特性は異なりますが、どちらも問題はありますが、小規模なデータセットではなく、アプリケーションにとって最適なデータベースを選択する必要があります。

あなたの問題についてよく知らないのは、単純なSQLデータベースから始めて、必要なときにスケーリングを心配することでしょう。

1つのノードでcassandraを実行すると正常に動作します。

1台の物理マシンで複数のVMを使用してhbaseを実行できると思われます。

+0

SQLデータベースを使い始めると、後者はマイグレーションする必要があり、それは簡単ではないかもしれません。複数のVMでHBaseを実行できますが、パフォーマンスは低下します。 –

+0

間違ったnosqlデータベースを選択した場合でも、移行する必要があります。最も簡単なことをする。 – sbridges

0

あなたは1つのノードHbaseも使用できます。 いずれにせよ、単一ノードHbase/Cassandraは、レプリケーションを持たないため、いくつかのノードとパフォーマンスが比較できません。

関連する問題