答えて

0

いいえ、正しくてもデータを再処理することはできます。部分書き込みを上書きします。 Cassandraに書き込むとき、同じ主キーでデータを挿入しようとしているときに一種の更新(upsert)が使用されます。

2

いいえ、Spark(とそのことについてはCassandra)は、タスク全体に基づいてコミットスタイルの挿入を行いません。これは、あなたの書き込みが冪等でなければならないことを意味します。そうでないと、奇妙な振る舞いで終わることがあります。

+0

偶数にする方法はありますか?私は間に失敗したタスクと最初からタスクを再開するcassandraテーブルの重複レコードの問題に直面しています –

+0

こんにちはすべて、この上の任意の入力?? –

+0

再試行で変更されたものから書き込みをしていないことを確認してください。非冪等の操作(リストやマップへの追加)には注意してください。基本的な偶発的なもの。コードの実行回数に関係なく、同じ書式を使用する必要があります。 – RussS

関連する問題