私はスパークするのが初めてです。なぜ、バッチがすべての使用例で効率的でない場合、Cassandraにバッチで書き込むのはなぜですか(例:savetocassandra操作)。実際にキャサンドラサイドやスパークサイドから気を取り除いてください。スパークカサンドラの特性を最適化した上で、キャサンドラから読んで、キャサンドラに返信するスパークの仕事をしているとき。スパークが内部的にCassandraへの一括書き込みを使用する理由
バッチ処理された書き込みまたは未書き込みのバッチ書き込みですか?
私はスパークするのが初めてです。なぜ、バッチがすべての使用例で効率的でない場合、Cassandraにバッチで書き込むのはなぜですか(例:savetocassandra操作)。実際にキャサンドラサイドやスパークサイドから気を取り除いてください。スパークカサンドラの特性を最適化した上で、キャサンドラから読んで、キャサンドラに返信するスパークの仕事をしているとき。スパークが内部的にCassandraへの一括書き込みを使用する理由
バッチ処理された書き込みまたは未書き込みのバッチ書き込みですか?
これはカサンドラにスパークするのは非常に具体的ではありませんが、
ある偉大な説明: 最大オーバードライブ:スパークカサンドラコネクタ(ラッセル・スピッツァー、DataStax)をチューニング| C * Summit 2016 https://www.youtube.com/watch?v=cKIHRD6kUOc
spark-cassandraコネクタは、未記録のバッチを使用します。 – phact
ジョブの実行を促すような種類の操作の非同期クエリよりも、未ログ記録のバッチがパフォーマンスが優れていることが分かります。 – phact
助けてくれてありがとう。 –