2
lst = ['a','b','c']
とこのようになりますデータフレームを:私は、データフレームに新しい列を作成するために探しています
id col1
1 ['a','c']
2 ['b']
3 ['b', 'a']
それは、COL1
id col1 intersect
1 ['a','c'] 2
2 ['b'] 1
3 ['d', 'a'] 1
からLSTの交差点や個々のリストの長さは、現在、私のコードは次のようになりましたこの:
df['intersection'] = np.nan
for i, r in df.iterrows():
## If-Statement to deal with Nans in col1
if r['col1'] == r['col1']:
df['intersection'][i] = len(set(r['col1']).intersection(set(lst)))
問題は、このコードは、非常に時間のかかる200K行の私のデータセットにし、200個の要素のリストと交差するということです。より効率的にこれを行う方法はありますか?
ありがとうございます!
のですか?私には常に真実のように見えますか? – Psidom
でnansを確認してください。 x == xは、xがnanの場合にfalseを返します。 – eljusticiero67