Amazon EMRクラスタでスパークジョブを実行した後、s3から出力ファイルを直接削除して、ジョブを再実行しようとしました。私はsqlContext.writeを使用してS3に寄木細工のファイル形式に書き込もうとすると、次のエラーを受け取りました:Emrfsファイルとs3が同期していない
'bucket/folder' present in the metadata but not s3
at com.amazon.ws.emr.hadoop.fs.consistency.ConsistencyCheckerS3FileSystem.getFileStatus(ConsistencyCheckerS3FileSystem.java:455)
私はそれを削除しなかったにもかかわらず、エラーを解決するようには見えなかった
emrfs sync s3://bucket/folder
を実行してみましたメタデータを追跡するDynamoDBインスタンスの一部のレコード。他に何ができるか分からない。このエラーを解決するにはどうすればよいですか?
私は同じ問題を持っている...同期は行いません。 s3から手動でファイルを削除するときに役立つもの。ドキュメンテーションは間違っていて誤解を招きます。 –
同じ問題を抱えていて、ドキュメントがそれについて非常に不明であることに同意しました。 – seiya