2017-05-17 1 views
1

Azure SQLデータウェアハウスにdistribution = hash()というテーブルを作成しました。ハッシングのために選択された列には1000の異なる値があり、表には約70億行があります。しかし、dbcc pdw_showspaceused( ')を使用してデータの配布を見たとき、node_id 1〜10しか見ることができませんでした。なぜなら、より明確な値を持つハッシュ用のGUID列を選択したにもかかわらず、システムが60ノードすべてに値を分散させるようにするためにできることはありますか?Azure SQLデータウェアハウスの60ノードにデータが分散されていません

SQL DWで

答えて

1

が60の分布はあるが、多数のノードあなたが分布が接続され、ここで見ることができる60

+0

ありがとうございます。私はノードの数がDWUレベルに依存しているのを知らなかった。あなたは私にドキュメンテーションを教えてもらえますか?それは非常に役に立ちます。 また、DWU 100でデータをロードし、データが6つのノードに分散されているとします。後でDWUを1000に変更すると(これは10ノードに限定されます)、前の6ノードから10ノードすべてにデータが分散されますか?私は "NO"だと思います。私が得るのは、より多くのメモリと同時実行スロットです。 – HimalayanNinja

+0

"ドキュメントを教えてください。 [配布と計算ノードの違い](https://docs.microsoft.com/en-us/azure/sql-data-warehouse/sql-data-warehouse-distributed-data#difference-between- a-distribution-and-a-compute-node) "前の6ノードから10ノードすべてにデータを分散させることはできますか? はい。それがノードとディストリビューションを分ける全体のポイントです。 –

2

の要因によって可能な電流DWUレベルによって決定されるもの分布を取り付け、かつノード:select * from sys.pdw_distributions データがすべての60のディストリビューションに分散されていることを確認したい場合は、HASH()の代わりにROUND_ROBINを使用します。 多分、このシステムビューから詳細を得ることができます:https://docs.microsoft.com/en-us/sql/relational-databases/system-catalog-views/sys-pdw-column-distribution-properties-transact-sql

関連する問題