変更列値

私は以下のように2のデータフレームを持っている：変更列値

DF1：

 Materials  Col2  Col3 ... 
1  Wood metal  X   Y 
2  Rock   X   Y 
3  Rock Metal  X   Y

DF2：私は最初のデータフレームをループしたい

 Mat 
1  Metal 
2  ...

材料の価値にdf2で見つけることができる単語が含まれている場合、私はそれを1に変更します：

df1 ：

 Materials Col2  Col3 ... 
1   1   X   Y 
2   0   X   Y 
3   1   X   Y

多くの感謝！ applyを使用せずにこれを行うには

出典

2017-05-17 hdatas

#check if Materials column contains any words from df2. This will also handle both lower case and upper case matching 

df1.Materials = df1.apply(lambda x: 1 if np.in1d(np.array(x.Materials.lower().split()),df2.Mat.str.lower()).any() else 0, axis=1) 

df1 
Out[2619]: 
    Materials Col2 Col3 
1   1  X  Y 
2   0  X  Y 
3   1  X  Y

出典

2017-05-17 20:59:28 Allen

は、それが働いたありがとう！ – hdatas

、あなたが使用することができpd.Series.str.containsとnp.where

import pandas as pd 
import numpy as np 

df1 = pd.DataFrame({'Materials': ['Wood metal', 'Rock', 'Rock Metal'], 
        'Col2': ['X', 'X', 'X'], 'Col3': ['Y', 'Y', 'Y']}) 

df2 = pd.DataFrame({'Mat': ['Metal']}) 

df1['Materials'] = np.where(df1['Materials'].str.lower().str.contains('|'.join(df2['Mat']).lower()), 1, 0)

出典

2017-05-17 21:15:38 EFT

答えて

関連する問題