2017-05-17 17 views
1

私はEMRオンデマンドサーバでPythonスクリプトを実行しています(EMRクラスタという名前はありません)。それは、ローカルシステムとして入力&出力を与えてもうまく動作します。私はS3バケツを入力&出力として使いたいと思う。以下の私のコマンドを見てください。 S3バケットファインから入力を受け取ります。しかし、S3ではなく私のローカルシステムにのみ出力を表示します。手伝っていただけませんか?S3へのEMR出力

$ python WordFrequency.py -r emr --region us-east-1 s3://mybucket/Input/Book.txt s3://mybucket/Output 

よろしく モハン

答えて

0

ちょうど他の誰がそれを必要とする場合には、ここでこれを置きます。私は、クエリと間違っ見る二つのものがあります:here

  • バケット内のフォルダに追加する場合は、フォルダのアドレスを閉じてする必要が説明したように

    1. はURLがなく、「S3」、「S3A」でなければなりませんオフ。 's3:// mybucket/Output'は 's3a:// mybucket/Output /'にする必要があります。

    3つ目のことは、emr/clientユーザーにはアクセスできないということです。バケツを最初に置きます。 EMR /クライアントユーザーのIAM設定で、そのユーザーにS3の読み込みと読み込みを許可し、書き込むバケットに正しいアクセス許可があることを確認します。

  • 関連する問題