2017-11-30 17 views
0

「Hiveでのパーティショニングは実行負荷を水平に分散する」と言ったHiveのパーティション化については、articleを読んでいます。水平荷重分散とは何ですか?

私は負荷分散の意味が水平であるか(垂直ではなく)、それが意味をなさないかどうか不思議です。そして、 "垂直に"分散して読み込むことができますか?

+0

https://stackoverflow.com/questions/19128940/what-is-the-difference-between-partitioning-and-bucketing-a-table-in-hive –

+0

上記のリンクを確認してください –

答えて

0

同じ種類のデータ用に異なるディレクトリを作成することを意味するテーブルをパーティション化したときのハイブ。例えば、 。 都市に関連する詳細を持つデータがあり、市に関連した詳細がプネーを想定できるようにしたいとします。

パーティションなし: プネー関連の詳細のみを検索する必要があります。これは、垂直方向のテーブル全体を意味します。

パーティション: 都市にパーティションを作成した場合、データはパーティションに分割されます。たとえば、プネー関連のデータはプネパーティションに移動し、プネに関連するデータにアクセスしようとすると、テーブル全体をスキャンする。

関連する問題