2017-11-06 8 views
1

最近、私はHadoopクラスタをS3でセットアップしています。すべてのデータファイルはHDFSではなくS3に格納されています.S3上でsparkとMPを正常に実行するので、namenodeがまだ必要かどうか、私はS3の上にhadoopアプリケーションを実行している間、私のnamenodeは何をしますか?ありがとう。HDFSの代わりにS3を使用する場合、Namenodeはまだ必要ですか?

答えて

0

いいえ、S3には配送作業コミッターが必要とする一貫性がないという事実に対処する手段があれば提供されます。 S3のリストに十分な一貫性がない場合、結果は無効になりますとなり、に気付かないことがあります。

Spark on AWSの異なるサプライヤは、それぞれ独自の方法でこれを解決します。 ASFスパークを使用している場合、これを行うことができるバンドルはありません。

https://www.youtube.com/watch?v=BgHrff5yAQo

関連する問題