2017-07-19 5 views
1

寄木細工のスキャンを行うとき、Impalaに辞書フィルタがあります。コメントには、列が100%辞書にエンコードされていることが示されています。どのような種類の列を辞書でエンコードすることができますか?辞書フィルタの例はありますか?どうもありがとう。Impalaの辞書フィルタとは何ですか?

答えて

0

行グループごとの辞書サイズは、uplimitを持ちます。impalaの場合、40000です。< 2.9。したがって、エンコードされた列のカーディナリティに関連しています。基本的に、1つの行グループに多くの異なる文字列がある場合、辞書のエンコーディングは100%になりません。これをさらに参照できますdocumentation