.csv
ファイルをHiveテーブルにORCファイルとしてロードします。HiveテーブルにHiveテーブルとしてORCとして一時的なHiveテーブルを読み込むことができません
CREATE TABLE IF NOT EXISTS CrimesData(ID int, Case_Number int, CrimeDate string, Block string , IUCR string,Primary_Type string, Description string, Location_Description string, Arrest string, Domestic string, Beat int, District int, Ward int, Community_Area int, FBI_Code string, X_Coordinate int, Y_Coordinate int, Year int, Updated_On string, Latitude decimal(10,10), Longitude decimal(10,10), CrimeLocation string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ESCAPED BY '"' LINES TERMINATED BY '\n'
tblproperties("skip.header.line.count"="1")
LOAD DATA LOCAL INPATH '/home/cloudera/Documents/CrimesData.csv' INTO TABLE CrimesData
:一時テーブルにテキストファイルとして作成
1)とのデータのロード:私は、私は以下のクエリを実行する問題の回避策を提案した1 post に出くわしました)
CREATE TABLE IF NOT EXISTS CrimesDataORC(ID int, Case_Number int, CrimeDate string, Block string , IUCR string,Primary_Type string, Description string, Location_Description string, Arrest string, Domestic string, Beat int, District int, Ward int, Community_Area int, FBI_Code string, X_Coordinate int, Y_Coordinate int, Year int, Updated_On string, Latitude decimal(10,10), Longitude decimal(10,10), CrimeLocation string)
STORED AS ORC;
3:2)新しいテーブルを作成し、ソースとしてORCデータを特定します一時テーブルから新しいテーブルにデータを挿入します。
INSERT INTO TABLE CrimesDataORC SELECT * FROM CrimesData;
最初の2つのステップがエラーなしで実行するが、ステップ3は、次のエラーがスローされます。
Error while processing statement: FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask
私はClouderaの上、上記のクエリを実行していますマネージャクイックスタートVM 5.8。
同じデータベース内の別のテーブルの同様の手順がどこで間違っているのかよく分かりません。
ありがとうございました。それがうまくいくかどうか試してみてください。 –
試行しました: INSERT INTO TABLE CrimesDataORC SELECT * FROM CrimesData LIMIT 10; しかしそれもうまくいかなかった.. :( –