ハイブ。既存のORCストレージのストライプサイズを確認してください
生ログからデータを解析し、それをHIVEのORCテーブルに書き込む2つのスクリプトがあります。 1つのスクリプトはより多くの列を作成し、もう1つは少なくしますどちらの表もdateフィールドで区切られています。 私は異なるサイズのファイルを持つORCテーブルを持っています。 列数の多い表は、多数の小さなファイル(各パーティション内のファイルごとに〜4MB)で構成され、列数が少ない表は少数の大きなファ
hadoop
hive
orc
2016-04-05