2016-07-12 13 views
0

HIVEでは、2つの方法で別々の行数を取得しようとしました。SQL/HIVE - Distinct count query - DISTINCTレコードのサブクエリでSELECT COUNT(DISTINCT列、..)とSELECT COUNT(*)の違いは何ですか?

  1. ​​

  2. SELECT COUNT (DISTINCT columns) FROM table;

両方が異なる結果をもたらすさ。 最初のクエリのカウントが2番目のクエリよりも大きいです。 どのように機能していますか? ありがとうございます。

+0

あなたはハイブのどのバージョンを使用していますか?あなたはImpalaを使っていますか?そして結果はどう違うのですか? –

+0

あなたの最初のコマンドは、Hiveで私にParseExceptionを与えます。それは "as temp_table_name"で終わるべきですか? – daemon12

答えて

0

すなわち例えば、あなたのためのサブクエリに名前を付け、あなたのクエリにわずかな変更を行います。

SELECT COUNT (*) FROM (SELECT DISTINCT columns FROM table) myquery; 
+0

コードの書式と一緒に説明すれば、あなたの答えが良くなります。 – Sid