HIVEテーブルからHIveテーブルに挿入中、実際のレコードよりも多くのレコードがロードされています。ハイブのこの奇妙な行動に誰かが助けてくれますか?HIveで実際よりも多くのレコードをロードしています
私のクエリは次のように見ていることになります。
insert overwrite table_a
select col1,col2,col3,... from table_b;
私table_bは6405465のレコードで構成されます。
table_aにtable_bから挿入した後、私はtable_aの総レコードが6406565.
ある見つけいずれかは、ここで助けてくださいことはできますか?
これらは異なって保存されていますか?多分あなたはいくつかのデータに 'table_a'行デリミタを持っています –
はい、table_bは通常のテキストテーブルです。 where as table_aはパーティション化されたテキストテーブルです。そして、両方のテーブルは '\ n'で区切られた行を持っていますが、 '\ t'で区切られた行があります。 –
これも参照してください:http://stackoverflow.com/a/39914232/2700344 count(*)の統計情報を使用しているかどうか確認してください。計算 – leftjoin