私はPythonを使ってSparkの作業を始めました。私はSparkML Linear Regression APIを使用するアプリケーションを開発中です。実行フェーズでYARNクラスタモードでジョブをサブミットすると、多くのpyspark-shellアプリケーションがユーザーとしてYARNで作成されます。私はYARNのUIでそれらを見ることができました。彼らは最終的に成功した状態で終了し、私が実際に提出した私のメインアプリケーションは成功した状態で終了します。これは期待される行動ですか?なぜなら、私はsingleton sparkSessionインスタンスを作成し、それをアプリケーション全体で使用するので、pyspark-shellセッション/アプリケーションが作成される理由はわかりません。PySparkアプリケーションは多くのpyspark-shellセッションを作成します
0
A
答えて
0
直接的な解決策は、sparkSessionの代わりにsparkContextを使用することです。しかし、複数のアプリケーションが作成されている理由を説明できるように、セッションをどのように作成しているかを確認するために、設定ラインを確認することは面白いでしょう。
Spark 1.6からSpark 2.2にアップデートしましたので、sparkSessions(2+で新しく追加されたもの)に真剣に取り組んでいません。
関連する問題
- 1. sqlalchemyセッションを作成する*または多くの関係を持つレコードを作成する
- 2. PHPトグルモーダルは、より多くのモーダルを作成します
- 3. SqlBulkCopyはDataTableより多くの行を作成します
- 4. Ionic3アプリケーションで管理モジュール(多分?)を作成しますか?
- 5. 多くの文書を作成する
- 6. 多くのサブページを作成する、symfony
- 7. SQLステートメントは多くの接続を作成し、データベースをハングします
- 8. Pyspark - pysparkで現在のビジネスビューを作成する
- 9. アプリケーションは、私が欲しかったiOSアプリを作成した後、あまりにも多くのバッテリー
- 10. pytest-covは一度に多くのアプリケーションをカバーします
- 11. Expressは各要求の新しいセッションを作成します
- 12. QuickBloxセッションの作成:Railsアプリケーションでの予期しない署名
- 13. icomoonは多くのクラスで1つのシンボルを作成します
- 14. jQueryは無限のスクロールでさらに多くのボタンを作成します
- 15. Android - 多くのビューを生成するときにアプリケーションがメインスレッドであまりにも多くの作業をしている可能性があります
- 16. アプリケーションをしばらく実行した後のPysparkソケットタイムアウト例外
- 17. WindowsアプリケーションのNhibernateセッション構成
- 18. SLURM/Sbatchは多くの小さな出力ファイルを作成します
- 19. SetIntervalは、多くのラウンド実行後に遅延を作成します。
- 20. なぜWatchServiceは非常に多くの操作を生成しますか?
- 21. git rebaseはgit mergeよりも多くの競合を作成しますか?
- 22. PHPは2つの異なるセッションを作成します
- 23. asp.netはどのようにセッションIDを作成しますか?
- 24. Pyspark - データフレームからトレーニングセットとテストセットを作成します
- 25. grails grom多対多マッピングの条件を作成します。
- 26. Xamarinは多言語アプリケーションを形成します
- 27. Tomcatは常に新しいセッションを作成します
- 28. アンドロイドでセッションを作成し、特定の時間にセッションを破棄します。
- 29. 多くのプロパティを持つオブジェクトを作成する方法は?
- 30. C++で多くのステップアルゴリズムの "マネージャ"を作成する方法は?
私もこの問題に直面していますが、一部のスクリプトでのみ発生するようです – chhantyal