に追加しない場合、私は2つのデータフレーム持って、確認してください。私がしたい、マスター列はリストから文字列が含まれている場合、それは、マスタ文字列から部分文字列を削除し、新しい列
df1=
A
0 Black Prada zebra leather Large
1 green Gucci striped Canvas small
2 blue Prada Monogram calf leather XL
df2=
color pattern material size
0 black zebra leather small
1 green striped canvas xl
2 yellow checkered calf leather medium
3 orange monogram
4 white plain
5 pinstripe
をdf2の列とdf1(不均一な大文字小文字と空白を制御する)を比較し、一致するものがあればdf1の新しい列に入力してAから削除します。牛革 "と誤解を招くことはありません。だから、結果はわずかに残っ非マッチした部分文字列のようになります。
df3=
A color pattern material size
0 Prada Large black zebra leather NaN
1 Gucci green striped canvas small
2 Prada blue Monogram calf leather XL
私はループに使用して試してみましたが、私のデータセットは非常に大きく、それが完全にパンダを利用していないような気がします。私も含まれていて、成功していないisinを試してみました。 .extractとdf2カラムを正規表現に変換する唯一の方法はありますか?ありがとう!
例df1の最初の行にエラーがありますか? 'プラダラージ'?私はあなたのデータで何を得ているのか分かりません。 – ryanjdillon
混乱を避けるため、希望の出力の名前をdf3に変更しました。しかし、df3は本当にdf1であり、列が追加され、その列に追加された文字列は列 "A"の文字列から削除されます – thaneofcawdor
データにはどのように欠損値が含まれていますか? – ryanjdillon