私たちは、Sparkを活用したい複雑な財務/ポートフォリオ分析を行っています。アプリケーションサーバーとしてsparkを使用しますか?
計算を実行し、データをSQLから取得する必要がある分離されたjarファイルをアプリケーションに提出するのではなく、アプリケーション全体をSparkドライバとして実行してSparkの結果メインアプリケーションからシームレスにアクセスできますか?
これはSparkの推奨使用ですか?このアプローチの潜在的な短所は何でしょうか?パフォーマンスやレイテンシの影響はありますか?
実行不可能で、スパークのために作られたものが無駄です。あなたはSpark Streamingを見なければなりません。あなたはSparkのデータをほぼリアルタイムで受け取ることができます。 –
@DavidGriffin、Spark StreamingとSparkは異なる目的を果たします。 OPのアプリケーションにSparkが必要な場合、なぜSpark Streamingを検討すべきですか? – Aivean
それらの違いは、質問者が探しているもの、つまり、Appサーバーをバックエンドするために、Sparkにデータを迅速に出し入れできることです。それ以外の場合は、Sparkで行うのとまったく同じことをSpark Streamingで行うことができます。私はStreamingで 'DataFrames'を使用しています。私は' GraphX'を使用しています。私はSpark Streamingアプリケーションで 'GraphFrames'を使い始めました。これは、質問者が望むものを論理的に推薦するものです。 –