Regex on DataFrameを使用してPythonを使用して新しい変数を作成するには

-1

以下のテキストデータがあります。新しいvarコールを作成する必要があります。正規表現を使用してください。次のコードを試したが、すべての行が「その他」となってしまった。Regex on DataFrameを使用してPythonを使用して新しい変数を作成するには

for pat in dt['Text']: 
    if re.search('Dropship',str(pat)): 
     dt['Recommend'] = 'DROPSHIP'  
    elif re.search('Dispatch',str(pat)): 
     dt['Recommend'] = 'DISPATCH' 
    elif re.search('Dispatch',str(pat)): 
     dt['Recommend'] = 'DISPATCH' 
    else: 
     dt['Recommend'] = 'OTHERS'

私を助けてください。

applyと

Data

出典

2017-10-19 Raju Kommarajula

recommend_list = [] 
for pat in dt['Text']: 
    if 'Dropship' in str(pat): 
     recomment_list.append('DROPSHIP') 
    elif 'Dispatch' in str(pat): 
     recomment_list.append('DISPATCH') 
    else: 
     recomment_list.append('OTHERS') 

dt['Recommend'] = recomment_list

出典

2017-10-19 11:49:03

このリンクは質問に答えるかもしれないが、ここでは答えの重要な部分が含まれており、参考のためにリンクを提供することをお勧めします。リンクされたページが変更された場合、リンクのみの回答は無効になります。 - [レビューの投稿]（/レビュー/低品質の投稿/ 17673015） – Faraday

ワンライナー：

df['Recommend'] = df['Text'].apply(lambda x: 'DROPSHIP' if 'Dropship' in x else 'DISPATCH' if 'Dispatch' in x else 'OTHER')

出典

2017-10-19 11:53:35 zipa

代わりのデータをループ、あなたは可能性があり、このようなオプションをループ：

replacements = {'Dropship': 'DROPSHIP', 'Dispatch': 'DISPATCH'} 
default_replacement = 'OTHERS' 

for pattern, replacement in replacements.items(): 
    items = dt['Text'].str.contains(pattern) 
    dt.loc[items, 'Recommend'] = replacement 

df['Recommend'].fillna(default_replacement, inplace=True)

出典

2017-10-19 11:53:51

あなたの場合はチェックが増加すると、チェックを含む関数を作成する方が簡単かもしれません。

def get_recommendation(text): 
    if re.match('Dropship',str(text)): 
     return('DROPSHIP')  
    elif re.search('Dispatch',str(text)): 
     return('DISPATCH') 
    elif re.search('Dispatch',str(text)): 
     return('DISPATCH') 
    else: 
     return('OTHERS')

あなたは、その関数を使用するようにapply()を使用することができます。

dt['Recommend'] = dt['Text'].apply(lambda x: get_recommendation(x))

出典

2017-10-19 11:58:00 clemens

Regex on DataFrameを使用してPythonを使用して新しい変数を作成するには

答えて

関連する問題