2017-02-08 16 views
0

文字列の ' - '部分の後ろにある文字列の一部を抽出する必要があります。PIGの文字列の一部を抽出

、言う

LONGNAMEアンドリュー・恒星アレックス-COOK

期待出力することができます:私が試した

COOK恒星

REGEX_EXTRACT(LONGNAME,'(-.*)',1) as shortname 

しかし、それは与える:

-COOK -Stellar

どのように私は削除することができますか ' - '?

答えて

0

試してもREPLACE機能を追加:

A = LOAD 'data' USING PigStorage() AS (longname:chararray); 

B = FOREACH A GENERATE REPLACE(REGEX_EXTRACT(longname,'(-.*)',1),'-','') as shortname; 

DUMP B; 

出力:

(恒星)それが働いた

+0

(COOK)。ありがとうたくさん – jsrkr55

+0

@ jsrkr55あなたは答えを受け入れることができます:) –

関連する問題