0
dataset.write.jdbc
メソッドを使用してデータベース(DB2)に巨大なデータセットを書き出しています。レコードの1つにDBに挿入する際に問題があると、データセット全体が失敗することがわかります。これは、データセットが巨大なパイプラインを走らせることによって準備されているので、高価であることが判明しています。永続性が失われたためにパイプライン全体を再実行することは理にかなっていません。スパークデータセットjdbc書き込みがバッチ更新で失敗する
問題の技術的解決策を探しています。設計練習ではありません。 –