2016-09-10 8 views
0

"大きな"レコードを格納する一時テーブルがあります。すべてのレコードは、「オフライン」で生成されるランダムな整数のリストです。Cassandra dbに多数のエントリを書き込む

1, <1,2,3,100,13> //random numbers 
2, <4,5,2,123,33> //random numbers 
3, <43,45,22,9,45> //random numbers 
    ... 

このリストには、千万のエントリがあります。

だから私の擬似コードで

typedef std::map<int, vector<int>> myMap; //datastructure 
myMap rows = initialize(); // 

行の変数は次のようなものが含まれています。

私の質問:これらのデータを私のcassandra dbにフラッシュする最良の方法は何ですか?私はそこに "行"変数を格納するためにテーブルを作成しました。データの整合性を損なうことなくこれらのデータをdbに保存するのは最適な方法ではないと思いますか?

答えて

0

あなたの懸念事項は何ですか?あなたが "遅い"ローディングを心配しているなら、sstableloaderを通してあなたのデータを送ることによってそれをスピードアップすることができます。あるいは、あなたがあまりにも怠けている場合は、1つずつ、おそらくは非同期の書き込みでフィードしてください。

関連する問題