私は毎日データが追加されるハイブテーブルを持っています。 したがって、毎日約5つのファイルが追加されます。 これで、この表の下に800個のファイルが完成しました。約800個のファイルを持つハイブテーブルを持つマッパーを制御する
私が持っている問題は、マッパーがファイルの数に比例するため、どこにでもこのテーブルに参加しているか使用しているということです。
しかし、私は自分のジョブを実行するためにテーブル全体を使用する必要があります。
テーブル全体を使用する方法はありますが、あまりに多くのマッパーをトリガーする方法はありませんか?
ファイルが
-rw-rw-r-- 3 XXXX hdfs 106610 2015-12-15 05:39 /apps/hive/warehouse/prod.db/TABLE1/000000_0_copy_1.deflate
-rw-rw-r-- 3 XXXX hdfs 106602 2015-12-23 12:31 /apps/hive/warehouse/prod.db/TABLE1/000000_0_copy_10.deflate
-rw-rw-r-- 3 XXXX hdfs 157686 2016-03-06 05:20 /apps/hive/warehouse/prod.db/TABLE1/000000_0_copy_100.deflate
-rw-rw-r-- 3 XXXX hdfs 163580 2016-03-07 05:22 /apps/hive/warehouse/prod.db/TABLE1/000000_0_copy_101.deflate