2017-03-11 12 views
0

で二重引用符で囲まれ、区切られたフィールドを持つCSVファイルをロードする方法:私はPIGにこのデータをロードすると豚 - 以下のように似ている、私はそれで.csvファイルやデータを持っているコンマ

001, 4567, 7012, “x,y,z”, abc, pqr, 56 
002, 3456, 5457, “t,f,q”, str, whg, 78 
003, 6782, 4562, “h,s,w”, uij, edc, 39 
004, 2348, 2673, “k,g,r”, plg, esa, 57 

PigStorage(‘,’)を使用すると、二重引用符内のデータは、データの '、'のために別のフィールドと見なされます。

私の要件は、引用符内のデータを1つのフィールドと見なし、別のフィールドはカンマ区切りに基づいて別々のフィールドと見なすことです。 誰かがこれをどのように達成できるかお勧めしますか?

おかげで、 のNaveen

+0

あなたは(http://www.crackinghadoop.com/hadoop-pig-loading-files-with-quotes-and-comma-delimiters [CSVLoaderまたはCSVExcelStorage]を試してみました/)? –

答えて

関連する問題