2016-06-16 15 views
2

特定の例では、を使用して、COPYを使用してcsvファイルから100k行をインポートしました。平均で約5.695秒かかりました。率:17559行/秒。シェルとPythonドライバを使用したCassandraデータのインポート時間

Cassandra Python driverを使用して同じデータを挿入した場合、execute_asyncには約13秒かかります。なぜそんなに大きな違いがありますか?

Cassandra localhostをWin 10 X64に設定しています。おそらく、クラスタ内のノードの数と関係がありますか、またはバッチを使用すると恩恵を受けることができますか?

答えて

2

CqlshはカサンドラPythonのドライバを使用して、最終的にexecute_asyncを呼び出して、ソースを表示することができますかなり頻繁にかかわらず、この時点で最適化された

https://github.com/apache/cassandra/blob/trunk/pylib/cqlshlib/copyutil.py https://github.com/apache/cassandra/tree/trunk/pylib/cqlshlib

その。これは、並行作業、カスタムロードバランサポリシー、およびいくつかの低レベルの拡張のためにトークン範囲を分割するようなことを行います。可能であれば、Pythonをネイティブコードに変換します。

関連する問題