私は各ディレクトリにN個のファイルを持つ複数のフォルダを含むdirを持っています。 1つのファイルサイズは15 GBになります。ファイルをローカルからHDFSにコピー/移動する最善の方法は何か分かりません。巨大なサイズのファイルをローカルからhdfsにロードするにはどうすればいいですか
0
A
答えて
0
はhdfs dfs -put /path/to/localdir/ hdfs://path/to/hdfsdir
hdfs dfs -copyFromLocal /path/to/localdir/ hdfs://path/to/hdfsdir
hdfs dfs -moveFromLocal /path/to/localdir/ hdfs://path/to/hdfsdir
hadoop distcp file:///path/to/localdir/ hdfs://namenode:port/path/to/hdfsdir
オプション1 & 2が同じである
- 、のような、(伝統的な方法を使用して)これを行うには多くの方法がありますあなたの場合。コピー時間に違いはありません。
オプション3は、データをHDFSファイルシステム(
-put
と同じ)にコピーしてからローカルファイルシステムからファイルを削除するので、もう少し時間がかかることがあります。オプション4はトリッキーなものです。クラスター内/クラスター内の大規模なコピー用に設計されています。しかし、ローカルファイルURLに "file://"接頭辞を付けることによっても、同じコマンドをローカルファイルに使用できます。これは、ツールがMapReduceを使用して並行して動作するように設計されており、ファイルがローカルにあるので、その強度を利用することができないので、最適な解決策ではありません。 (クラスタノードにマウントを作成すると、distcpのパフォーマンスが向上する可能性があります)
関連する問題
- 1. ローカルのノートパソコンからリモートHDFSにファイルを置くにはどうすればいいですか?
- 2. WindowsのローカルHDFSにアクセスするにはどうすればよいですか?
- 3. 巨大なAIFFファイルを救済するにはどうすればいいですか?
- 4. ファイルからNSAttributeStringをロードするにはどうすればよいですか?
- 5. IDLEが巨大なリストを印刷するのを止めるにはどうすればいいですか?
- 6. Canvasで巨大な白いビットマップを作成するにはどうすればよいですか?
- 7. 大きなCSVファイルを扱うにはどうすればいいですか?
- 8. 巨大なWordPressマルチサイトデータベースを別々のMySQLデータベースに分割するにはどうすればよいですか?
- 9. モノにGIFファイルをロードするにはどうすればいいですか?
- 10. UIWebWiew内にロードされたローカルHTMLファイルからアクセスできるファイルにJSON応答を保存するにはどうすればいいですか?
- 11. S3からAmazon EMR HDFSにファイルをコピーするにはどうすればよいですか?
- 12. メモリが限られた巨大なイメージデータセットにzcaを適用するにはどうすればいいですか?どのようなGoogleの
- 13. ローカルの.SQLファイルをMySQLにロードするにはどうすればよいですか?
- 14. 巨大なscript.sqlデータベースをSQL Server 2008に復元するにはどうすればよいですか?
- 15. イメージのサイズをいくらか大きくするにはどうすればよいですか?
- 16. iOSからローカル音楽ファイルにプログラムでアクセスするにはどうすればいいですか?
- 17. イメージのサイズをコマンドラインから最大2MBにバッチするにはどうすればよいですか?
- 18. HDFSブロックの大きさはどれくらいですか?
- 19. 巨大なラスタスタックを使用して計算をスピードアップするにはどうすればよいですか?
- 20. SRパーサーファイルをマッパーのhdfsにロードするにはどうすればよいですか?
- 21. 巨大なファイルから
- 22. グラフ "画像"から大きなサイズを戻すにはどうすればよいですか?
- 23. * .corpusファイルをPythonにロードするにはどうすればよいですか?
- 24. ブラウザからNode.jsサーバーに大きなファイルを送信するにはどうすればよいですか?
- 25. CSVファイルからnumpy配列にデータをロードするにはどうすればいいですか?
- 26. ローカルcsvファイルからPythonデータセットを作成するにはどうすればいいですか?
- 27. hdfsのファイル名をより効率的に変更するにはどうすればいいですか?
- 28. コンテナの滑らかなカロウズのサイズを親の100%にするにはどうすればいいですか?
- 29. ウェブサイトのhttps側のhttpdocsからファイルをロードするにはどうすればいいですか
- 30. PyQt:ユーザーからファイル名の大きなリストを取得するにはどうすればよいですか?