ファイルがHFDSまたはローカルファイルシステムにある場合、EMRFSを有効にしてこのファイルをS3にコピーしてすぐにクラスタをシャットダウンし、このコピー操作が完了するとすぐにリストアップして外部の読者に読んでください。または、EMRFSは、有効になった特定のEMRクラスター内でのみ一貫性がありますか? HDFSからEMRFS経由でS3にファイルをコピーするとどうなるでしょうか?ローカルのファイルシステムから?EMRFSは外部クライアントに対してS3を一貫させます
答えて
私はこの同じ質問をAWS開発者フォーラムhttps://forums.aws.amazon.com/thread.jspa?threadID=257220&tstart=25で尋ねました。これには多くの貴重な詳細が含まれており、EMRFSのすべてのIMOドキュメントよりもEMRFSの概要がはるかに優れていますが、
1)一貫性のあるビューは、EMRFS構成で明示的に有効にする必要がある機能です。それ以外の場合は、S3の一貫性の保証のみがあります。
2)は、通常
3)S3が提供する唯一の真の一貫性保証は、新しいファイルがあることである同じEMRFSが、それはS3にアクセスする外部クライアントには影響しませんconfiguration--一貫したビューでのみ共有し、クラスタ内に有効になりますEMRFSこれまでに書かれていないものは、一貫性が保証されていますが、リストには含まれません。したがって、クライアントが新しく作成されたパスによってファイルを要求すると、常にそれが取得されますが、リスト操作でファイルのパスが取得される場合とされない場合があります。クライアントが読み取り操作でどのバージョンを取得するかは保証されません。
EMRFSは、EMR hadoopジョブによって作成されたオブジェクトに対して有効な一貫性のあるビューです。
1)EMRFSの主な目的は、hadoopジョブによって作成されたオブジェクトが即座に一貫していることです。したがって、依存関係がある場合は、ファイルを次のジョブに使用できます。
2)ファイルをS3にコピーして、次のhadoopジョブと一貫性を持たせる方法は、ファイルをhdfsにコピーし、s3 次のコマンドを使用してコピーします。
- HDFS DFS -put file.txtを/ユーザー/ Hadoopの/
- HDFS DFS -cp /user/hadoop/file.txt S3://バケット名
s3のファイルをリストするのは非常にコストがかかります。データをs3で一貫性のあるものにするには、s3にインデックスを実装する必要があります。以下は、dynamodb https://aws.amazon.com/blogs/big-data/building-and-maintaining-an-amazon-s3-metadata-index-without-servers/を使用して、ファイルを即座に一貫性のあるものにするためのリンクですか?
s3 apiを使用すると、s3整合性はEMRFSメタデータを経由しないため、画像になります。
- 1. emrfsはs3 urlのカスタムクエリパラメータをサポートしていますか?
- 2. emrfs一貫性のあるビューとコマンドラインのコピー/削除
- 3. ストレージとしてEMRFS(s3バケット)を使用してEMR 5.3.0を作成します。
- 4. S3 - 最終的な一貫性と複数のクライアント
- 5. Emrfsファイルとs3が同期していない
- 6. socket.ioは一貫して接続されていません
- 7. XMLRPC - Python Server、PHPクライアント。一貫性はありませんか?
- 8. PCIE領域が一貫しておらず、一貫していません
- 9. クラスが一貫していません
- 10. コンパイルミスが一貫していません
- 11. 一部のクライアントでクッキーが設定されていません
- 12. Amazon S3のデータの一貫性モデル
- 13. TDSドライバの取得 - java.lang.NullPointerException。この例外は一貫していません
- 14. .serialize()はすべてのブラウザで一貫していません
- 15. jquery ui multiselectプラグインは一貫してドラッグをドロップさせません
- 16. Hibernateはローカルタイムスタンプを一貫して返しません
- 17. MPPlayableContentDataSourceが一貫して呼び出されません
- 18. は一貫して低いと予測されています
- 19. TFSチェックインはVS 2015のファイルを一貫して除外します
- 20. コード化されたUIはコントロールを一貫して認識しません
- 21. Javascriptファイルは一貫して読み込まれませんか?
- 22. iphone一貫してUITextView内の一部のテキストを非表示にする
- 23. Java regex String.matchesは一貫して動作しません
- 24. フラスコのアプリは一貫して起動しません
- 25. angularjs $ setPrestineは一貫して動作しません
- 26. S3のオブジェクトのメタデータを強く一貫した
- 27. アクションケーブルを使用して状態を一貫させる方法
- 28. GitHub READMEはAWS S3の外部イメージを表示します
- 29. MVCアクションパラメータがnullable GUidに一貫してバインドしません
- 30. Django外部SSOに対して認証