2016-05-17 5 views
0

こんにちは私は配列からデータを抽出するために豚を使用しています!ちょうどタプル(nom_d_hote)から! データはどのように私は豚の配列のタプルからデータを区切るために正規表現を使用することができます

Direction-name-engtp.dzと私は名前だけ 名を抽出する正規表現を使用したいreprésente
DCL-GUETTACHE.engtp.dz 
DCL-GUETTACHE.engtp.dz 
DG-MESLOUB.engtp.dz 
DG-MESLOUB.engtp.dz 
DG-MESLOUB.engtp.dz 

のようになりますあなたは私の豚とどのように正規表現の仕事の例を表示することができますし、どうすればいいですか?

答えて

0

リレーションAのフィールド名をf1とすると、リレーションAのf1から名前を抽出することができます。

- と - (エスケープドット)の間にすべての(。*)を入力します。私はこのような股関節データをロードしていますので、私はhcatalogからテーブルを使用してい

NAME = FOREACH A GENERATE REGEX_EXTRACT_ALL(A.f1,'-(.*)\\.)') as name; 
+0

:org.apache.hcatalog.pig.HCatLoader()を使用してA = LOAD 'テーブル';私はhcatalogからテーブルを使用している場合、正規表現を1タプルに適用したいと思うnom_d_hote式は "。* - (。*)。engtp.dz $" –

関連する問題