計算はほぼリアルタイムで(最大100msで)実行する必要があり、容易に並列化できる適度に複雑な計算が必要です。私たちが検討しているオプションの1つは、Apache Hadoop YARNとは別にバッチモードでsparkを使用することです。私はスパークするバッチジョブを送信することは、しかし、巨大なオーバーヘッドがあることを読んだ。これらは、このオーバーヘッドを削減/排除する方法ですか?スパークバッチジョブ作成のオーバーヘッドを削減する方法
0
A
答えて
0
スパークは、利用可能なリソース、つまりメモリとコアを利用しています。 Sparkはデータの局所性の概念を使用します。
データとその上で動作するコードがまとめて計算よりも高速になる傾向がある場合。しかし、コードとデータが分離されていれば、一方は他方に移動する必要があります。通常、コードサイズがデータよりもはるかに小さいため、シリアライズされたコードをデータのチャンクよりも先に発送するほうが速くなります。 リソースが不足している場合は、必ずスケジューリングと処理時間が掛かります。スパークは、データの局所性というこの一般的な原則の周りでスケジューリングを構築します。
スパークはすべてのタスクを最高の地域レベルでスケジュールすることを推奨しますが、これは必ずしも可能ではありません。 チェックhttps://spark.apache.org/docs/1.2.0/tuning.html#data-locality
関連する問題
- 1. 隠された反応コンポーネント、リスナーを「オフにする」方法/パフォーマンスのオーバーヘッドを削減する方法は?
- 2. ノンクラスタードインデックススキャンコストを削減する方法
- 3. pythonマルチプロセッシング:syプロセスのオーバーヘッドを減らす方法はありますか?
- 4. 加算と減算のサブルーチンを作成する方法
- 5. JavaScriptを減らす方法Accumulatorオブジェクトを作成する
- 6. lucene indexWriterオーバーヘッドを作成しますか?
- 7. 各操作のRealmインスタンスを作成する際のオーバーヘッド/問題?
- 8. インデックスを作成してデータベースのコストを削減しますか?
- 9. Groovyで多くの機能を作成するオーバーヘッドを作成する
- 10. angularjsで$ emitと$ broadcastを使用するオーバーヘッドを減らす
- 11. AJDTのメモリ消費量を削減する方法は?
- 12. WPFアプリケーションのCPU使用量を削減する方法は?
- 13. Amazon RDS PostgreSQLのストレージ使用量を削減する方法は?
- 14. SQL Serverの物理メモリ使用量を削減する方法
- 15. Log4j Loggerを作成する際のオーバーヘッドは何ですか?
- 16. 警告:2競合を削減/削減[-Wconflicts-RR] yacc文法で
- 17. 減算の結果である図形からポリゴンを作成する方法
- 18. ビデオストリームの処理中にCPUオーバーヘッドを減らす
- 19. gzipedで圧縮するときのCSSテキストファイルサイズの削減方法
- 20. Yii2:カスタム削除ボタンの作成方法
- 21. アーキテクチャー:ハッシュマップを作成するときにGCオーバーヘッドの問題を解決する方法
- 22. Railsでルートを削除するフォームを作成する方法
- 23. マングースのコレクションの作成/削除をカスケードする良い方法
- 24. 静的メソッドはオーバーヘッドを減らしますか?
- 25. FFmpegでmjpegストリームのピクセル化を削除/減らす方法
- 26. 円形寸法削減?
- 27. トランザクション内で複数のアイテムを作成/削除する方法
- 28. 1回のリクエストでファイルを作成、ダウンロード、削除する方法
- 29. C#レジストリキーを削除する方法の作成
- 30. rails 3.1のlink_toで削除ルートを作成する方法は?