2017-04-17 4 views
0

.csvファイルをHiveテーブルにORCファイルとしてロードします。HiveテーブルにHiveテーブルとしてORCとして一時的なHiveテーブルを読み込むことができません

CREATE TABLE IF NOT EXISTS CrimesData(ID int, Case_Number int, CrimeDate string, Block string , IUCR string,Primary_Type string, Description string, Location_Description string, Arrest string, Domestic string, Beat int, District int, Ward int, Community_Area int, FBI_Code string, X_Coordinate int, Y_Coordinate int, Year int, Updated_On string, Latitude decimal(10,10), Longitude decimal(10,10), CrimeLocation string) 
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ESCAPED BY '"' LINES TERMINATED BY '\n' 
tblproperties("skip.header.line.count"="1") 
LOAD DATA LOCAL INPATH '/home/cloudera/Documents/CrimesData.csv' INTO TABLE CrimesData 

:一時テーブルにテキストファイルとして作成

1)とのデータのロード:私は、私は以下のクエリを実行する問題の回避策を提案した1 post に出くわしました)

CREATE TABLE IF NOT EXISTS CrimesDataORC(ID int, Case_Number int, CrimeDate string, Block string , IUCR string,Primary_Type string, Description string, Location_Description string, Arrest string, Domestic string, Beat int, District int, Ward int, Community_Area int, FBI_Code string, X_Coordinate int, Y_Coordinate int, Year int, Updated_On string, Latitude decimal(10,10), Longitude decimal(10,10), CrimeLocation string) 
STORED AS ORC; 

3:2)新しいテーブルを作成し、ソースとしてORCデータを特定します一時テーブルから新しいテーブルにデータを挿入します。

INSERT INTO TABLE CrimesDataORC SELECT * FROM CrimesData; 

最初の2つのステップがエラーなしで実行するが、ステップ3は、次のエラーがスローされます。

Error while processing statement: FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

私はClouderaの上、上記のクエリを実行していますマネージャクイックスタートVM 5.8。

同じデータベース内の別のテーブルの同様の手順がどこで間違っているのかよく分かりません。

答えて

0

これは、データの種類が構造に準拠していない可能性があります。 selectステートメントの条件を設定して、すべてのデータを挿入するかどうか確認してください。

+0

ありがとうございました。それがうまくいくかどうか試してみてください。 –

+0

試行しました: INSERT INTO TABLE CrimesDataORC SELECT * FROM CrimesData LIMIT 10; しかしそれもうまくいかなかった.. :( –

関連する問題