私は1つのHIVEテーブルに非常に多くのファイルを分析しようとしています。主要な洞察力、私はjsonファイルで作業しており、テーブル構造は次のとおりです。いくつかのファイルをHIVEテーブルにロードしてください
CREATE EXTERNAL TABLE test1
(
STATIONS ARRAY<STRING>,
SCHEMESUSPENDED STRING,
TIMELOAD TIMESTAMP
)
ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe'
LOCATION '/user/andres/hive/bixihistorical/';
すべて同じ構造で約50個のファイルをロードする必要があります。上記のもののいずれかが、私はスルー行くべきかについてのアイデアみんな働いている
LOAD DATA INPATH '/user/andres/datasets/bixi2017/*.json'
OVERWRITE INTO TABLE test1;
LOAD DATA INPATH '/user/andres/datasets/bixi2017/*'
OVERWRITE INTO TABLE test1;
LOAD DATA INPATH '/user/andres/datasets/bixi2017/'
OVERWRITE INTO TABLE test1;
:私はのようなものを試してみましたか? ありがとうございます
私は転記で私の例を見てみました。だから、私がやったことは、ファイルのリポジトリへの場所を目指すcreate tableにあった!ありがとう –