ハイブからの単一ファイル出力

私はAzure Blobにファイルを保存するためにSerDeを使用するハイブテーブルを持っています。ハイブからの単一ファイル出力

field 1 int, 
field 2 string, 
field 3 struct 
ROW FORMAT SERDE 
    'org.apache.hive.hcatalog.data.JsonSerDe' 
STORED AS INPUTFORMAT 
    'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
    'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'

私はテーブルに5000件のレコードを挿入すると、出力はAzureストレージ上の5000個の塊で構成され、それぞれに複数のレコードをブロブの数を削減しても、単一のブロブとして出力を保存したりする方法があります？

出典

2017-04-26 Ravi Shastri

HiveIgnoreKeyTextOutputFormatによって、HDFSファイルを書き込むための無視キー機能が原因と考えられます。 HiveBinaryOutputFormatなどの他の出力形式を指定してください。

出典

2017-04-28 08:11:14

ハイブからの単一ファイル出力

答えて

関連する問題