spark2-submitを実行してpysparkスクリプトを介して入力ファイルを処理することによって、入力データファイルが到着したときに処理する必要があります。私が見てきたことは、すべてのspark2 - submitについて、sparkは最新の入力ファイルのデータ処理を行う前に多くの初期化を行うことです。その結果、遅延が生じます。どのようにしてspark2の提出物の間にSparkクラスターを生かしておくことができますか?spark2-submits間でSparkクラスタを生かし続けるには?
個別のしかし関連する質問:spark2-submitとは別に、ペイロードを送信するために使用できる他のメカニズムは何ですか?
あなたの洞察を事前に感謝します。
どのようなSparkスケジューラを使用していますか? –