与えられた単語と一致する順列を探し、列の位置に基づいてデータを整列したい。他の列の単語の同様の順列を見つける
IE - 私はそれがこのようなものになります、私はいくつかのwebsites.Sayから廃棄データをCSVを作成しました。その後、私は(1)Name2はで名1から各単語の順列を見つけたい
Name1 OtherVars Name2 More Vars
Stanford 23451 Mamford No
MIT yes stanfor1d 12
BeachBoys pie Beatles Sweeden
をし、 (2)Name1からその単語を含むテーブルを印刷する+それはOtherVarsの一致する単語であり、Name2のその単語の順列+ MoreVarsの一致です。 (一致するものが見つからない場合は、単に単語を削除してください)。
結果は、この場合には次のようになります。だから、
Name1 OtherVars Name2 More Vars
Stanford 23451 stanford 12
、どのように私ん:
は、他の列内の単語の一致順列を探しますか?
2つの単語とそれが他の列にマップされている値を出力しますか?
PS - これは似たような質問です。しかし、それはJavaであり、それは疑似コードです。 How to find all permutations of a given word in a given text? Difflibはこれに基づいてCSVをに適していないようです:How to find the most similar word in a list in python
PS2 - 私はしかしFuzzymatch
を使用することをお勧めして、私はそれがこのケースでやり過ぎだと思われます。
「Name2」の2番目のエントリには1が含まれていますか? – marisbest2
また、この場合の「順列」とは何ですか?また、「類似」をどのように定義していますか? – marisbest2
はい@ marisbest2はそこにあることを意味します。パーミュテーションは、Levenshtein Distance、またはさらに優れたユーザ定義関数を使用できるほど類似していると定義されます。 – oba2311