私は1つの列とその列に1000行だけのデータフレームを持っています。 すべての行を比較し、すべての行についてLevenshtein距離を見つける必要があります。私はPythonでその比率または距離を計算するにはどうすればよいPythonで私の列の行のLevenshtein率/距離を計算するには?
は、私は次のようにデータフレームを持っている:
#Df
StepDescription
click confirm button when done
you have logged on
please log in to proceed
click on confirm button
Dolb was released successfully
Enter your details
validate the statement
Aval was released sucessfully
は何をするどのように私は、私は、ループを反復処理するために書かれているすべてのこれらの
コードのためのレーベンシュタイン比を計算しますどのように進めるかを反復した後である。
import Levenshtein
import pandas as pd
data_dist = pd.read_csv('path\Data_TestDescription.csv')
df = pd.DataFrame(data_dist)
for index, row in df.iterrows():
期待される出力?あなたは何も試したことがないようです。 –
私はパーセンテージ、つまり各行と各行の比率を取得する必要があります。私はこれらの行の間のこの距離を計算する方法を反復した後に私が知らないので試していません。 –
私はまだ何らかの期待される出力を見たいと思っています。 –