私はPandasデータフレームを反復処理し、すべての組み合わせではなく各行のペアについてのみfuzz.ratioスコアを取得します。私のデータフレームは、次のようになります。Python FuzzyWuzzy Pandasデータフレームの行のスコア
Acct_Owner、住所、アドレス2
0、名1は、NaN、33リバティ・ストリート
1、Name2は、330 N Wabashのアヴェスイート39300、330北Wabash Avenue Suite 39300
欠損値があるため、値の欠落行をスキップするために "try:"を使用しています。
for row in df_high_scores.index:
k1 = df_high_scores.get_value(row, 'Address')
k2 = df_high_scores.get_value(row, 'Address2')
try:
df_high_scores['Address_Score'] = fuzz.ratio(k1, k2)
except:
None
結果はすべての行で同じスコアを示している。以下は、forループ電流があります。ループがループを繰り返さずに各行にスコアを付ける理由を理解したいと思っています。読んでいただきありがとうございます...
ありがとうBabu!前者のアプローチは機能し、完璧な意味を持ちます。大きなデータで問題が発生した場合は、.Applyオプションを使用します。 –