;これは、NaN値になりは、データフレームの列に任意の値をマージし、私は次の「単位」欄に任意の列にマージしようとしている
from pandas import DataFrame
import pandas as pd
import difflib
df1 = DataFrame([[1,'034567','Foo'],
[2,'1cd2346','Bar']],
columns=['UID','Unit','Name'])
df2 = DataFrame([['SellTEST','0ab1234567,034567'],
['superVAR','1cd2346']],
columns=['Seller', 'Unit'])
merge2_df = pd.merge(df1, df2, on=['Unit'], how='left')
merge2
:
UID Unit Name Seller
0 1 034567 Foo NaN
1 2 1cd2346 Bar superVAR
を
私が見てみたいことはあるとき:
UID Unit Name Seller
0 1 034567 Foo SellTEST
1 2 1cd2346 Bar superVAR
私はCSVからデータをインポートしていますので、いくつかのフィールドは、国連の複数の値が含まれますそれ'。理想的には、私はマージ中にこれを処理できるようにしたいと思います。助言がありますか?
DF2の最初のユニットは「034567」ではないので、その代わりに、それは素晴らしいことだそうだ0ab1234567,034567 " –