私はApache Pigを学習しています。私はブタにいくつかのデータをロードしようとしています。 viエディタでtxtファイルを見ると、次の(サンプル)行が見つかります。Apache Pig - 豚の関係にロード中に数字のデータが見つかりません
[ABBOTT、ディーディーWのGRADES 9-12教師52,122.10 0 LBOE アトランタ私立学校SYSTEM 2010]。
次のコマンドを使用して、データをブタの関係にロードします。
A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage() as (name:chararray,
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int);
Iは、分散環境での豚にダンプを行う場合しかし、私は(上記行の場合)、次の結果を見つける:
(ABBOTT、ディーディーW、GRADES 9~12教師、0.0、LBOE、アトランタ独立、 SCHOOL SYSTEM、2010)。
数値データ"52,122.10 "
が欠けているようです。
助けてください。
ファイルセパレータは何ですか?それはタブですか? –
はいMurali、タブ区切りです。 – Nemichandra
PigStorage( '\ t')を読み込んでみてください –