私はgoogleのdataprocクラスタが初期化アクションを処理するために備えられていることを理解しています。これはすべてのノードの作成時に実行されます。しかし、これは小規模なアクションでは妥当であり、大規模なパイプラインに依存する多数の依存関係とソフトウェアを持つノードの作成ではうまくいかないでしょう。つまり、ノードをカスタムイメージとしてロードしたり、ノードが作成された後にイメージがスピンアップして、すべてのインストールが行われているので、何度も何度もダウンロードする必要はありません。Dataprocノードの設定
0
A
答えて
0
良い質問です。
現在、initialization actionsは、作成時にClustersにインストールする標準的な方法です。依存関係がたくさんある場合や、ソースからコンパイルするなどの作業を行う必要がある場合は、これらの初期化アクションに少し時間がかかることがあります。
私たちは長期的なロードマップのカスタマイズを処理するためのより良い方法をサポートしています。これは、カスタム画像または他の何らかの仕組みによるものでもよい。
一時的に、スケーリングクラスタのアップ/ダウンは、カスタマイズの一部を適切に保ち、ブート時間とクラスタの永続性の差を分割したい場合には、いくらか軽減されます。同様に、プリコンパイルされたパッケージがある場合、それらは常に時間を節約します。
関連する問題
- 1. Google Dataprocノードのアイドル
- 2. Dataprocのハイブ認定
- 3. dataproc、特にspark.yarn.am.memoryのデフォルト設定を有効にする
- 4. カサンドラの4ノード設定は、3ノード設定と同じです
- 5. Elasticsearch Tribeノードの設定
- 6. Dataprocの「処理ノード」とは何ですか?
- 7. Google Cloud DataprocクラスタのJupyter Notebookをフリートレイル期間に誰が設定しますか?
- 8. neo4jのノードの動的プロパティの設定
- 9. 企業内のノードの設定
- 10. Googleデータストアでのノードのページ設定
- 11. Fedora 27のノードjsサーバーの設定
- 12. ツリーの表現 - ノードの設定
- 13. C++のノードのメモリアドレスを設定する
- 14. googleクラウドのdataprocクラスタ
- 15. DataprocのBigQueryとPyspark
- 16. Dataprocがoozieパッケージ
- 17. Dataproc bdutil versioning
- 18. ベアメタル展開用Kubernetesノードの設定
- 19. Jtreeの各ノードにアイコンを設定
- 20. ノードjs +ジャスミンでカルマ設定を設定するには
- 21. LinuxでSeleniumノードを設定する
- 22. ノード設定角度cli環境
- 23. S3とノードを設定する
- 24. C++ - NULLにノードを設定すると
- 25. ノードとコモドを設定するには?
- 26. ドッキング・セレン・ノード/クロムにプロキシを設定
- 27. Google Cloud DataprocへのTalendコネクタ
- 28. DataProcクラスターのGoogle Cloud Sdk
- 29. Google DataProcのspark-shellとsparkR
- 30. DataprocのSpark 2.0とScala 2.11?