2016-03-19 4 views
1

一般的に、Amazon EMRとHadoopの新機能です。私は現在、EMRクラスタ上でPigジョブをセットアップし、S3からデータをインポートおよびエクスポートしようとしています。私は "datastackexchange"という名前のデータでs3にバケットを設定しました。私はいくつかの重要なをしないのです推測エラスティックマップReduceとamazon s3:アクセスキーに関するエラー

AWS Access Key ID and Secret Access Key must be specified as the username or password (respectively) of a s3 URL, or by setting the fs.s3.awsAccessKeyId or fs.s3.awsSecretAccessKey properties (respectively). 

ls s3://datastackexchange 

そして、私は次のエラーメッセージと会っています:豚にデータをコピーするために開始しようとする試みで、私は、次のコマンドを使用していましたステップ(おそらくアクセスキーの設定を含む)。私がEMRを非常に新しくしているので、誰かがこのエラーを取り除き、私のS3データをEMRで使用できるようにするために必要なことを説明してもらえますか?

ご協力いただきありがとうございます。ありがとうございます。

答えて

0

正しく表示されているように、EMRインスタンスにはS3データへのアクセス権がありません。 S3データにアクセスするためのAWS認証情報を指定するには多くの方法がありますが、正しい方法はS3データにアクセスするためのIAMロールを作成することです。

Configure IAM Roles for Amazon EMRは、関連するステップを説明しています。

関連する問題