2017-02-27 4 views
0

私はApache Pigを学習しています。私はブタにいくつかのデータをロードしようとしています。 viエディタでtxtファイルを見ると、次の(サンプル)行が見つかります。Apache Pig - 豚の関係にロード中に数字のデータが見つかりません

[ABBOTT、ディーディーWのGRADES 9-12教師52,122.10 0 LBOE アトランタ私立学校SYSTEM 2010]。

次のコマンドを使用して、データをブタの関係にロードします。

A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage() as (name:chararray, 
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int); 

Iは、分散環境での豚にダンプを行う場合しかし、私は(上記行の場合)、次の結果を見つける:

(ABBOTT、ディーディーW、GRADES 9~12教師、0.0、LBOE、アトランタ独立、 SCHOOL SYSTEM、2010)。

数値データ"52,122.10 "が欠けているようです。

助けてください。

+0

ファイルセパレータは何ですか?それはタブですか? –

+0

はいMurali、タブ区切りです。 – Nemichandra

+0

PigStorage( '\ t')を読み込んでみてください –

答えて

0

PigStorage()は、レコード区切り文字を引数として持つpigのinbuilt関数です。ここのタブ - > \ t

A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage('\t') as (name:chararray, 
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int); 
+0

助けてくれてありがとう。それはうまくいった。 – Nemichandra

+0

@ネミチャンドラ:助けがあれば、この回答を受け入れることができます。 –

関連する問題