0
UNION
に含まれるいずれのテーブルよりも2つのテーブルのUNION
のテーブルが小さいのはなぜですか?HiveQL:ユニオンテーブルがどちらのコンポーネントテーブルよりも小さい
CREATE TABLE adb.table4 STORED AS ORC AS
SELECT a.*
FROM adb.table2 a
UNION
SELECT b.*
FROM adb.table3 b;
hive> SELECT COUNT(1) FROM adb.table4;
15,961,225
Time taken: 0.084 seconds, Fetched: 1 row(s)
hive> SELECT COUNT(1) FROM adb.table2;
70,152,930
Time taken: 0.085 seconds, Fetched: 1 row(s)
hive> SELECT COUNT(1) FROM adb.table3;
39,384,833
です。なぜなら、 'union'は重複をなくして1つを保持するからです。 –