2016-04-29 6 views
0

現在私はXML形式の50M +文書を保管するためにCassandraを使用しています。私は狩りをしてきましたが、カサンドラにこのデータを一括してロードする方法については、Javaを書く必要はありません。XMLファイルをCassandraに一括読み込み

ドキュメントの本体に何かが含まれているとすれば、CSVが扱いにくいかもしれませんが、このデータを任意の形式に変換するスクリプトを書くことができます。

おかげ

Siの

答えて

2

あなたはいくつかの種類の区切り形式(つまり、CSV)にXMLを変換するために喜んでいる場合は、ここではカップルのオプションは次のとおりです。

  1. COPY commandcqlshにあります。これは実際に最新のバージョンのCassandraで大きなperformance boostを取得しました。
  2. cassandra-loader utility。これははるかに柔軟性があり、ファイル形式に応じて調整できるさまざまなオプションがあります。

は、Java(例えば、Pythonの)以外のコードを書くために喜んでいる場合は、プログラミング言語の束のためのCassandra drivers availableがあります。他の言語があればJavaを学ぶ必要はありません。

+0

私はcassandra-loaderが仕事をしてくれると思いますが、CSVに関する私の懸念はXML本体のコンテンツのランダムな性質でしたが、私はカスタムデリミタを使用できるので、 Pythonのアプローチのために行くことができる、私はC#を行くだろうが、それはLinuxサーバからWindowsサーバに50M +ファイルを取得することを意味するので、ローダに問題がある場合、Pythonのアプローチはより魅力的なように聞こえる。乾杯 – Simon

関連する問題