2017-10-24 3 views
0

歩行者の総歩数と最高歩数を数え上げるためのスクリプトを作成しました。私が得られないことは、Pig Outputでヘッダーを生成することです。その結果、出力はすっきりとしてきれいに見えます。出力の書き込み中にヘッダーを生成する方法はありますか?私のコードがされた後、私の出力の豚の出産のヘッダー

register 'piggybank-0.15.0.jar'; 
DEFINE CSVLoader org.apache.pig.piggybank.storage.CSVLoader(); 
part1 = LOAD '/home/cloudera/Pedestrian_Counts.csv' using CSVLoader(',') as (date_time, sensor_id: int, sensor_name: chararray, hourly_counts: int); 
part2 = GROUP part1 BY (sensor_id, sensor_name); 
part3 = FOREACH part2 GENERATE FLATTEN(group) AS (sensor_id, sensor_name), SUM(part1.hourly_counts), MAX(part1.hourly_counts); 
STORE part3 into '/home/cloudera/pedestrian_result' using PigStorage('\t'); 

第5行は

1 Bourke Street Mall (North) 49591633 5573 
2 Bourke Street Mall (South) 67759939 7035 
3 Melbourne Central 70973929 5890 
4 Town Hall (West) 90274498 8052 
5 Princes Bridge 58752043 7391 

は、我々は出力を書き込み中にヘッダを置くことができ、次のようにありますか?前もって感謝します。

答えて

1

ヘッダー情報を持つローカルファイルシステムのファイルにすべてのパーツファイルデータをマージするか、このブタスクリプトの出力をハイブテーブルに保存します。

出力を格納するためのHiveテーブルの使用には、独自のスキーマがあります。

HiveをPigにアクセスするには、Hcatを使用する必要があります。