2016-08-01 1 views
0
create external table review 
(
business_id string, 
user_id string, 
stars Double, 
text string, 
date date, 
votes struct < 
vote_type :string , 
count: int >) 
ROW FORMAT SERDE 'com.cloudera.hive.serde.JSONSerDe' 

; 

テーブルでJSONを解析するが、エラーを与えているレビューからハイブすなわち..select星に星と日付フィールド を解析しようとするとエラーを取得設定します。使用Yelpのデータが正しくロードされるハイブ

データセットは、以下のリンクから使用して、テーブルには、その場所をポイントするように、あなたはこのようなLOCATION「/ユーザー/ ruchit31 /神/」としてポインタを与えるべきでJSON形式で https://www.yelp.com/dataset_challenge

答えて

0

です。テーブルの作成を変更する

create external table review 
(business_id string, 
user_id string, 
stars Double, 
text string, 
date date, 
votes struct < vote_type :string , count: int > 
) 
ROW FORMAT SERDE 'com.cloudera.hive.serde.JSONSerDe' 
LOCATION '/path/' 
+0

私は、さらに、テーブルのレビューに「ファイルのパス」というコマンドを使用しているため、問題はありません。問題はダブルと日付の列のデータを取得するときに発生します。これらのフィールドに必要なデータ型を正しく使用しているかどうかはわかりません。 – Nayyar

関連する問題