2017-03-07 6 views

答えて

0

S3 syncは、HDFSパスを認識しません。すべてのS3 properties関連を設定した後

いずれかを使用し、

  • hadoop distcp
  • S3DistCp、これはs3distcp.jarを必要とします。
  • ファイルが小さい場合は、syncファイルをローカルパスに、copyFromLocalをHDFSにコピーします。
+0

私は 'sync'を使用していましたが、' S3Distcp'を使用すると、データをS3からHDFSに移動するステップを減らすことができます。 s3distcp jarをインストールしましたが、エラーが表示されます。 – GOU7HAM

+0

あなたが 'AWS_ACCESS_KEY'と' AWS_SECRET_ACCESS_KEY'を持っているなら、Distcp自体を使うことができます。 's3distcp'からのエラーに関して、完全なスタックトレースをポストすることについて新しい質問を開くことができます。 – franklinsijo

関連する問題