本の中で、次のように動作します:非同期更新のためのスパーク。
"バッチで作成されているため、共有データの非同期更新(たとえば、オンライントランザクション処理など)には適していません。スパークストリーミングは、時間ウィンドウ内のデータに適用されるバッチ分析です。これらのユースケースに特化したツールは、引き続き必要になります。
誰かが説明したのはそれですか?
私はいくつかのETLプロセスを実行するためにスパークを使用することに興味があります。私はカフカを途中で使用するつもりであることに注意してください。私は問題を理解していませんが。カフカからデータを取り込んでデータベースに書き込むのは、やはり同じ問題です。それはparrallelで行われます。