S3に内部テーブルと外部テーブルがあります。 HDFSとS3の内部テーブルの違いは何ですか? S3に格納されている内部テーブルと外部テーブルの違いは何ですか? S3で外部テーブルを削除すると、マスターノードのメタデータが削除され、S3のデータがそこにあります。その後、メタデータが削除されてからS3のデータにアクセスできますか?S3に内部テーブルと外部テーブルの両方を格納することの違い
1
A
答えて
0
ハイブテーブルは、S3(内部)(管理対象)または外部(外部)がS3またはHDFS内にあることは関係ありません。テーブル(管理対象または外部)タイプとストレージ(S3、HDFS)の間には接続がありません。
管理対象テーブルと外部テーブルの違いは、テーブルまたはパーティションを削除すると、ファイルのある場所も削除されることです。外部テーブルまたはそのパーティションを削除すると、場所が残ります。メタデータのみが削除されます。ファイルを直接読み取るか、Hiveテーブルまたはパーティションを作成して場所を指定することで、S3またはHDFSの場所にあるデータにアクセスできます。同じ場所を指す複数のテーブルを作成することもできますが、S3やHDFSは関係ありません。
HDFSとS3にはS3の最終的な一貫性など、多くの違いがあります。 S3とHDFSの違いについてはこちらをご覧ください:https://www.xplenty.com/blog/2014/03/storing-apache-hadoop-data-cloud-hdfs-vs-s3/ そして、ここで:https://databricks.com/blog/2017/05/31/top-5-reasons-for-choosing-s3-over-hdfs.html
また、結果整合性についてはこの回答を参照してください。https://stackoverflow.com/a/42677748/2700344
関連する問題
- 1. 内部リンクと外部リンクの違い
- 2. 外部テーブルとSQLLoader
- 3. は、外部テーブルfile_fdwの参加とPostgreSQL 9.5では、外部テーブル
- 4. myISAMテーブルとInnoDBテーブルの外部キー
- 5. この親に対する外部キーは、子テーブルにゼロとして格納されます。
- 6. OneToMany - 結合テーブルと外部キーの違いは何ですか?
- 7. SQL - 内部結合の結果を新しいテーブルに格納しますか?
- 8. ハイブの内部テーブルとエクステンデットテーブルのパフォーマンスの違い
- 9. GPath式を外部に格納する
- 10. のMySQL:外部キーを追加すると、ここでMyISAMテーブル
- 11. テーブル内の外部キーを参照するときのエラー
- 12. モデルオブジェクトとコアデータと外部ソースの両方
- 13. mysql内部結合テーブル1とテーブル2
- 14. SQLデータベース内の2つのテーブルまたは外部キーとの内部結合?
- 15. EF:Includeを使用するときに外部テーブルの外部テーブルが含まれていますか?
- 16. 外部ソートと内部ソートの違いは何ですか?
- 17. 6つのテーブルと内部結合と左外部結合の結合 - LINQ
- 18. AspNetUserテーブルIDを外部キーとして別のテーブルにマップする方法
- 19. ハイドロープの外部テーブル
- 20. テーブルのすべての外部キーと複数の外部キーを同じテーブルに一覧表示する
- 21. 外部テーブルから外部テーブルにデータを挿入
- 22. NSManagedObjectの内部にブロックを格納することはできますか?
- 23. テーブル内の外部キーのショートカット
- 24. DB2外部テーブル?
- 25. bash - 作業ディレクトリの外部にファイルを格納する方法
- 26. 同じテーブルの主キーと外部キー
- 27. これは私が作成した外部テーブルで外部テーブルにロードデータ
- 28. Vim:Columnvise内部と外部のインクリメント?外のことで
- 29. KTableデータを外部DBに格納
- 30. Hiveの外部テーブルと内部テーブルはいつ行う必要がありますか?
私は私のメタデータを保存するためのRDSを使用しています、のiはS3で管理し、外部表を持っていると仮定しましょう私はEC2のインスタンスを持っていると私はクエリ1を実行しています。EC2インスタンスは、マスターノードといくつかのコアノードが3つのコアノードを言うでしょう。マスターノードは、右のメタデータを持っている必要がありますか?私はクラスタを失った場合、私はメタデットで行った変更に何が起こるでしょうか?2.データはs3に格納されているので、管理されたテーブルで作業している場合、データはコアノードのいずれかになければなりません。どのパラメータマスタノードがどのコアノードにタスクを割り当てるかを決定することに基づく – I1095
S3データはクラスタノードに格納されず、NASに格納され、多くのクラスタからアクセスできます。したがって、クラスタを失った場合、データはS3にとどまります。メタデータは、RDS(例えばMySQL)に格納することができます。 – leftjoin