ハイブのバージョン:1.2.1HiveのSQL "Alter Table/Partition Concatenate"ファイルの生成を減らすには?
構成:
set hive.execution.engine=tez;
set hive.merge.mapredfiles=true;
set hive.merge.smallfiles.avgsize=256000000;
set hive.merge.tezfiles=true;
HQL:
ALTER TABLE `table_name` PARTITION (partion_name1 = 'val1', partion_name2='val2', partion_name3='val3', partion_name4='val4') CONCATENATE;
私は特定のテーブル/パーティションのファイルをマージするHQLを使用しています。しかし、実行後も出力ディレクトリにはまだ多くのファイルがあります。それらのサイズは256000000よりはるかに小さいです。どのように出力ファイルの数を減らすか。
ところで、Tezの代わりにMapReduceを使用しても動作しませんでした。
あなたはテーブルDDLを投稿できますか? – SrinivasR