2011-08-16 5 views
2

Hectorのバッチ変異の長所と短所を強調し、Hadoopジョブを使用してCassandraにデータをロードできますか?Hectorのバッチ変異とHadoopジョブを使用してCassandraにデータをロードするか?

mutator.addInsertion(...); 
mutator.execute(); 

そしてHadoopの中であなたがカサンドラにデータをロードするMRジョブを使用することができます。

私はヘクターに次のような何かを行うことができます知っています。

私は、それぞれを使用する理由と使用しない理由を探しています。ありがとう!

答えて

2

データソースが現在hadoop(またはhbase)にない場合は、上記のようにMutatorを使用してマルチスレッドローダーを使用して可動部分の数を減らすことをお勧めします。

この要旨は日付が、アプローチは同様であろう: https://gist.github.com/397574

は、あなたがより多くの細部をしたいなら、私に教えてください。

+0

ありがとうzznate。私はそれについてもっと詳しく知りたいと思うでしょう。今、私はちょうどストレートmutator.addInsertion()CSVを読み込むために使用しています。私はあなたがそれを持っている場合、コードのマルチスレッドセクションを見たいと思います。私がhadoopジョブを使うことを考えていたのは、私が[mumakil](https://github.com/Ganglion/mumakil/blob/master/src/mumakil/load/LoadTable.java)を見ていたからです。しかし、その解決法はちょうど正規の突然変異体よりも少し複雑です。 – max

関連する問題