Spark on Scalaを使用してCassandraテーブルにデータを書き込もうとしています。スパークタスクが間に失敗し、部分的な書き込みがあることがあります。 Sparkは新しいタスクが最初から開始されたときに部分書き込みをロールバックしますか?Cassandraにデータを挿入するためのスパークジョブ
1
A
答えて
0
いいえ、正しくてもデータを再処理することはできます。部分書き込みを上書きします。 Cassandraに書き込むとき、同じ主キーでデータを挿入しようとしているときに一種の更新(upsert)が使用されます。
2
いいえ、Spark(とそのことについてはCassandra)は、タスク全体に基づいてコミットスタイルの挿入を行いません。これは、あなたの書き込みが冪等でなければならないことを意味します。そうでないと、奇妙な振る舞いで終わることがあります。
関連する問題
- 1. Cassandraにデータを挿入するためのSpark SQL
- 2. データを挿入するためのmysqli_query
- 3. Cassandraテーブルにデータを挿入するSpark DataFrameを使用する
- 4. SparkスカラCassandra CSVをcassandraに挿入
- 5. Cassandraテーブルにjsonファイルを挿入する
- 6. cassandraにヌル値を挿入する
- 7. AFTER INSERT初期テーブルにデータを挿入した後、別のテーブルにデータを挿入するためのトリガー
- 8. AkkaストリームでCassandraに挿入
- 9. 春データCassandraはセル墓石を作成する挿入
- 10. C#でデータベースにアクセスするためにデータを挿入する
- 11. PHPデータをデータベースに挿入するためのフォームを作成
- 12. SQLiteにデータ値を挿入するための同期ループ
- 13. 新しい列にデータを挿入するためのSQLクエリ
- 14. 行とデータを昇順に挿入するためのVBAコード
- 15. SQL Serverの - を挿入するために挿入/後 - ロールバック
- 16. C#Batch 40000行をCassandra DBに挿入
- 17. Spark 1.6 aデータフレームをCassandraに挿入
- 18. BigIntをノードjsからcassandraに挿入
- 19. Cassandra - テーブルのTTLとTTLを使用したデータの挿入との違い
- 20. cassandraの別のテーブルから選択してcassandraテーブルに挿入するには?
- 21. テーブルにデータを挿入するための挿入トリガの前にMySQLを書くには?
- 22. データを再挿入するためのmysqlビュー
- 23. Scala Spark Cassandraプライマリキーでローを更新または挿入する
- 24. ルックアップテーブルにデータを挿入するためのフェニックスの移行またはシード
- 25. python cassandraドライバを使用してcassandraに最も速く挿入する方法
- 26. Druid/Cassandraのデータベースに100万行+秒を挿入する
- 27. イメージを挿入するためのwp_localize_script
- 28. mysql - 挿入後に他のテーブルにデータを挿入するトリガー
- 29. Cassandraの連続測定挿入速度
- 30. MongoDBにデータを挿入するために豚が失敗する
偶数にする方法はありますか?私は間に失敗したタスクと最初からタスクを再開するcassandraテーブルの重複レコードの問題に直面しています –
こんにちはすべて、この上の任意の入力?? –
再試行で変更されたものから書き込みをしていないことを確認してください。非冪等の操作(リストやマップへの追加)には注意してください。基本的な偶発的なもの。コードの実行回数に関係なく、同じ書式を使用する必要があります。 – RussS