2016-03-31 18 views
0

ハイブでdataの下にインポートしようとしています。ハイブクエリcsvテキスト区切り文字

名前、電話番号、住所

Arverne,(718) 634-4784,"*312 Beach 54 Street 
Arverne, NY 11692 
(40.59428994144626, -73.78442865540268)*" 

Astoria,(718) 278-2220,"*14 01 Astoria Boulevard 
Long Island City, NY 11102 
(40.77152402451418, -73.92643545073543)*" 

Auburndale,(718) 352-2027,"*25 55 Francis Lewis Boulevard 
Flushing, NY 11358 
(40.76035096822195, -73.79632645819947)*" 

しかし、アドレスは3-4であるためアドレスは、私は(デフォルトでは\ nを取ることによって、終端ラインの問題を推測 適切に来て、したがって、破損したテーブルのデータをされていませんライン)、クエリ

create table test(c1 string, c2 string, c3 string) 
row format serde 'com.bizo.hive.serde.csv.CSVSerde' 
with serdeproperties(
"separatorChar" = ","); 
以下と私はサンプルデータの下に走った

a,b,"e,f" 

x,y,"l,m" 

を引き起こします

test.c1 test.c2 test.c3

a b c,d 

e f g,z 

私はこれを実現するにはどうすればよい:細かい作業210

その?

答えて

0

これは私が働いた方法です。

>>> CREATE TABLE Test(name string, phone string, address string) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE; 
>>> load data inpath 'file.csv' into table Test; 

>>> select name from hiveTest; 
+-------------+--+ 
| name  | 
+-------------+--+ 
| Arverne  | 
| Astoria  | 
| Auburndale | 
+-------------+--+ 
>>> select address from hiveTest; 
+--------------------------------------------+--+ 
|     address     | 
+--------------------------------------------+--+ 
| "312 Beach 54 Street Arverne    | 
| "14 01 Astoria Boulevard Long Island City | 
| "25 55 Francis Lewis Boulevard Flushing | 
+--------------------------------------------+--+ 

私はそれが助けになると思います。

+0

アドレスは切り捨てられます。 "312 Beach 54 Street Arverne、NY 11692(40.59428994144626、-73.78442865540268)" – sr7

+0

これを試してください:my_table(name string、phone string、address string)の行形式serde 'com.bizo.hive.serdeを作成してください。テキストファイルとして保存されたserdeproperties( "separatorChar" = "\ t"、 "quoteChar" = "'"、 "escapeChar" = "\\")を持つcsv.CSVSerde。 reqirementに従ってserdepropertiesを変更してください。 – srikanth

+0

は既にこれらのオプションで試しています( "separatorChar" = "、" quoteChar "=" \ ""、 "escapeChar" = "\ n")....再び動作しません。リンク:https://nycopendata.socrata.com/Recreation/Queens-Library-Branches/kh3d-xhq7? – sr7