スパークについての私の理解は、RDDでreduce操作を実行すると、異なるノードによって並列に操作され、結果がマスターノードによって蓄積されることです。これらの操作は並行して実行されるため、結果は全体として利用可能であり、処理中に実行される更新に依存することはできません。たとえば、共有キャブアプリケーションを設計していると、トリップの開始位置と実際の位置異なるキャブ。私は簡単に旅行開始ポイントから各タクシーの距離を取得するためにスパークSQLを実行することができます。一度、私はこれを持って、私は最短距離のタクシーを選び、それを割り当てる必要があります。今ここで私たちはタクシーが4回以上の旅行を取ることができないという条件があります。私の分析は並行して実行されているので、すでにキャブがフルキャパシティであるかどうかはわかりません。では、これを検証する最良の方法は何ですか?共有変数を持つことができますか、データベースに割り当てを保存する必要があります。パフォーマンスはスパークでのような何の機能はありませんキーSpark RDD:並列操作のためにデータを共有する方法
-2
A
答えて
0
で、あなたはより多くの詳細についてはApacheのIgnite を利用することができます私たちは、今のよう点火するためにジャンプすることはできませんリンク https://apacheignite.readme.io/docs
関連する問題
- 1. 2つのSparkコンテキスト間でSpark RDDを共有するには?
- 2. SparkでJavaRDDパーティション間でデータを共有する方法は?
- 3. アプリケーション間のデータ共有 - 共有メモリとD-Busとファイル操作
- 4. spark RDDで複数の操作を実行するパフォーマンス
- 5. Scala RDD文字列操作
- 6. リストの反復を並列化してSparkでRDDを作成する方法は?
- 7. Spark RDD [Array [MyObject]]をRDDに変換する方法[MyObject]
- 8. Windowsで共有操作をトリガする方法8
- 9. 共有モックを使った並列テスト
- 10. 同時スパークジョブでRDDを共有する方法
- 11. ミューテックスとセマフォを使用して共有データを操作する
- 12. アンドロイド - '共有'メニューを操作する
- 13. 列をRDDに追加するSpark 1.2.1
- 14. RDD操作
- 15. SparkでRDDを作成するさまざまな方法
- 16. spark RDDでパーティションを作成する方法
- 17. JavaスレッドでArrayList操作を並列化する方法は?
- 18. RDD(Spark)のアイテムをRDDの多くのアイテムに変換する方法は?
- 19. Spark RDDまたはデータフレーム内のランダムシャッフル列
- 20. バイナリ検索操作のための並べ替えられた配列を取得する方法?
- 21. Spark RDDを使用して別のRDDを作成またはマッピングする方法
- 22. RDDで配列をマージする方法
- 23. Androidでテキストを共有するためのアプリピッカーを作成する方法は?
- 24. SparkのRDDへのマッピング方法
- 25. 文字列RDD結合操作
- 26. ラベルからのRDD配列とデータ配列のpython/spark
- 27. Apache Spark RDD:ペアドRDDキーと値に基づいて最新のデータを取得する方法
- 28. spark-shell(spark 2.1.1)のsparkのハイブサポートを有効にする方法
- 29. Python 2で並列プロセスのデータを同時に読み込み、共有して処理する方法は?
- 30. 複数のnumpy配列をspark rddにロードする最速の方法は?
を参照してください。私はそれがスパークでは不可能であることを知っています、そして、それが理由です、私たちはスパークの外にそれを保管する必要があります。私の質問は、パフォーマンスに与える影響が最も少ないこのようなシナリオのベストプラクティスです。 – Piyush