私はsparkストリーミングがデータを処理するためにマイクロバッチを使用することを知っていますが、場合によっては1秒未満で処理が行われます。私の質問は、「そのシナリオでリアルタイム処理に近いものではなく、純粋なリアルタイム処理と呼ぶことはできないのですか?スパークストリーミングはなぜリアルタイムに近いと呼ばれていますか?
0
A
答えて
1
私は、データが収集され、ダッシュボードやシステムに直接プッシュされた場合、ETLプロセスを一切使用せずに、メトリック、アラート、最適化のリアルタイムについてのみ話すことができますが、リアルタイムの目的は、主に、速度。
履歴傾向またはベンチマークを抽出するバッチ処理のプロセスがある場合は、セカンド未満にもかかわらず、リアルタイムではなく近くにあります。これは、ほぼリアルタイムで話すためです。
質問に答えるには、バッチ処理しているため、リアルタイムに近いとは言えません。
私はそれが役に立ちそうです。
ファン
1
スパークストリーミング内部RDDS、各バッチ間隔のための1つのシーケンスであるDstreams呼ばX秒のバッチにデータストリームを分割します。各RDDには、バッチ間隔中に受信したレコードが含まれています。そのプロセスは、リアルタイムではなく、ほぼリアルタイムで呼び出されます。
+0
ありがとうございます@vaquarkhan – dalonlobo
関連する問題
- 1. なぜそれはonBlurと呼ばれていますか?
- 2. なぜ「Here Strings」は「Here Strings」と呼ばれていますか?
- 3. キュウリとカピバラはなぜ呼ばれていますか?
- 4. なぜAJAXは非同期と呼ばれていますか?
- 5. なぜLogcatはLogCATと呼ばれていますか
- 6. なぜasp.net MVCは軽量と呼ばれていますか?
- 7. Silverlight:なぜXAPはXAPと呼ばれていますか?
- 8. なぜ__PRETTY_FUNCTION__は__PRETTY_FUNCTION__と呼ばれていますか?
- 9. なぜコントロールはXamarinのビューと呼ばれていますか?
- 10. なぜandroid:id、android:textAppearanceなどと呼ばれていますか?
- 11. なぜ '選択'がDML文と呼ばれていますか?
- 12. なぜCounterの__init__メソッドがディスクリプタと呼ばれていますか?
- 13. なぜpostgresqlでテーブルがリレーションと呼ばれていますか?
- 14. なぜCommon Table Expressionが "Common"と呼ばれていますか?
- 15. なぜファントムクエリと呼ばれていますか?
- 16. なぜGraph APIと呼ばれていますか?
- 17. なぜ機能はレデックスサンクと呼ばれていません
- 18. なぜtarballはtarballだけでなくtarballと呼ばれていますか?
- 19. なぜシグナルは単にイベントと呼ばれていませんか?
- 20. MySQL:なぜUTF-8は文字セットと呼ばれていますか?
- 21. なぜMatlabの匿名関数は匿名と呼ばれていますか?
- 22. なぜ角度2の "フィルタ"は "パイプ"と呼ばれていますか?
- 23. なぜJavaのLambda式が "lambda"と呼ばれていますか?
- 24. なぜCakePHPの自動トランザクションオプションが "アトミック"と呼ばれていますか?
- 25. メソッドはまだ実行されていないと呼ばれています
- 26. なぜ `join`は` mu`とも呼ばれますか?
- 27. なぜglibcバイナリがlibc.so.6と呼ばれるのではなく、libc.so.1またはlibc.so.4と呼ばれていますか?
- 28. "application/octet-stream"が "application/byte-stream"と呼ばれないのはなぜですか?
- 29. なぜ非同期プロセスは同期と呼ばれないのですか?
- 30. これらのコントロールは何と呼ばれていますか?
ありがとうございました@Juan、それは疑いを解消します – dalonlobo
私はビッグデータのエキスパートに尋ねました。彼はビッグデータでスパークストリーミングは精密さが近いのでリアルタイムに近いと考えていますStormや新しいSpark(Structured Streamming)のようなフレームワークでは、ビッグデータの純粋主義者がリアルタイムで呼ぶような、ナノ秒の精度で作業します。 – Juan