私はApache Sparkの上にRESTful APIを構築しています。で次のPythonスクリプトを提供して正常に動作するようです:なぜ単純なWebフレームワークではなく、Livyやspark-jobserverですか?
import cherrypy
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('myApp').getOrCreate()
sc = spark.sparkContext
class doStuff(object):
@cherrypy.expose
def compute(self, user_input):
# do something spark-y with the user input
return user_output
cherrypy.quickstart(doStuff())
しかし、グーグルでは、私の周りにはLivyとspark-jobserverのようなものを参照してください。私はこれらのプロジェクトのドキュメントとチュートリアルを読んでいますが、CherryPyやFlaskなどのWebフレームワークを使った簡単なスクリプトでLivyやspark-jobserverの利点を十分に理解することはできません。それはスケーラビリティについてですか?コンテキスト管理?私はここで何が欠けていますか?私が欲しいのは、多くのユーザーがいない単純なRESTful APIで、Livyやspark-jobserverが問題になるのでしょうか?もしそうなら、なぜですか?