スパークジョブの出力をhdfsに書き込んでそこからダウンロードする必要がありますか?あるいは、ローカルのファイルシステムに直接書き込むこともできます。スパーク・ジョブからハード・ディスクを直接読み書きできますか?
1
A
答えて
1
基本的に、ローカルのファイルシステムファイルに書き込むためにsparkのネイティブAPI(例:df.write.parquet
)を使用することはできません。スパークローカルモード(クラスタではなく自分のコンピュータ上)で実行しているときは、ローカルファイルシステムから読み書きします。しかし、クラスタ設定(スタンドアロン/ YARN/etc)では、パーティションは[一般的に]別々のノードに格納されているため、HDFSへの書き込みは唯一の論理的なアプローチです。 HDFSへの書き込み
1)ノードローカルファイルシステムへの書き込みは1つのノード上のすべての異なるノード上のファイル(5つのファイルを意味します、ドライバーのファイルシステムに別の7つのファイルなど)
2)書き込みは、あなたが伝統的なI/Oを使用してドライバローカルファイルシステムに書き込むことができますcollect
を実行しているに似ドライバーにすべてのexecutorの結果を送信する必要になりますPythonやScalaのような言語に組み込まれた操作
関連のSO:
Save a spark RDD to the local file system using Java
Spark (Scala) Writing (and reading) to local file system from driver
関連する問題
- 1. 書き込みシステムコールはデータを直接ディスクに書き込みますか?
- 2. JEDI JCLメモリを圧縮する/ディスクに直接書き込みますか?
- 3. ディスクに直接書き込む方法
- 4. スパークの使用s3から読み込み、s3から書き込むことはできますか?
- 5. ディスクに流し込んで書き込みスパークをシャッフル
- 6. ダイナモdbをApacheのスパークから読み込み/書き込みする
- 7. JNI:直接バッファの読み込みと書き込み
- 8. どのようにディスクの読み書きオーバーヘッドを減らすのですか?
- 9. Rustのリーダーから直接書き込みする
- 10. JAVAでスパークしてHBASEからデータを読み書きする方法
- 11. 資産から直接読み取り専用でsqliteを開きます
- 12. Rubyzip:tmpfileをディスクに書き込まなくても、S3に直接ZIPファイルをエクスポートできますか?
- 13. 直接ファイルをHDFSから直接読み取る
- 14. Androidビットマップピクセル - ファイルに直接書き込みますか?
- 15. SBT:ディスクから変数を読み取ることはできますか?
- 16. Windowsのコマンドプロンプトからレジストリ値を直接読み込み、標準のWindowsコマンドで使用できますか?
- 17. 相対パスからファイルを読み書きできません
- 18. PageFileから読み書きする
- 19. ファイルから読み書きする
- 20. は書き込めません/スパークから直接点火するためにデータを保存RDD
- 21. ディスクから読み込んだときにNodejsがクラッシュする
- 22. ubuntuサーバーの通常のディスク読み取り/書き込み値
- 23. スパーク・ジョブはアクターを使用できますか?
- 24. 名前付きFIFOパイプはディスクの書き込みと読み取りを使用しますか?
- 25. ディスク書き込み操作をフックしますか? Win32/64
- 26. オブジェクトのNSMutableArrayをディスクに保存/書き込みしますか?
- 27. ファイル/ディスクにSerializeオブジェクト(kyro)を読み書きする?
- 28. データをディスクに書き込んでそこから読み取る最も良い方法は何ですか?
- 29. Django - プレーンテキストからの読み書き
- 30. jsのコンソールからの読み書き