Hive 1.2でベーステーブルを作成するために、約14個のテーブルを結合しています。各テーブルには、数百万レコードを持っていると私はORCファイル形式を使用していたクエリHiveの多くのテーブルで効果的な結合を実行する
hive.exec.dynamic.partition=true;
hive.exec.max.dynamic.partitions.pernode=200000;
hive.exec.max.dynamic.partitions=200000;
hive.exec.max.created.files=250000;
hive.enforce.bucketing=true;
hive.auto.convert.join=false;
mapreduce.map.memory.mb=8192;
mapreduce.reduce.memory.mb=8192;
mapred.reduce.child.java.opts=-Xmx8096m;
mapred.map.child.java.opts=-Xmx8096m;
hive.exec.dynamic.partition.mode=nonstrict;
を実行し、IDに基づいてテーブルをバケット化し、年、四半期、月に基づいて、テーブルを分割する際にこれらのパラメータを使用します。この表は、明らかに結合の点で重い計算を実行します。他のパラメータを知らせたり、より効果的に結合を実行するために使用できる別の戦略を実行したりしてください。