私は、NCAAのチーム名の配列とそれらに関連する統計を持っています。学校名はしばしば短縮されるか、完全に除外されますが、アラバマクリムゾンタイドとクリムゾンタイドのように、名前のすべてのバリエーションに共通の要素が通常あります。これらの名前はすべて、特定の順序で配列に含まれています。私はそれらをあいまいにマッチングさせてチーム名のすべてのバリエーションを取って、すべてのバリエーションを1つの名前にリネームすることができるようにしたいと思います。私はPython 2.7で作業しており、すべてのデータを持つ配列があります。前にファジーマッチングを使ったことがないので、助けてください。Pythonで配列の列に項目をあいまいにする方法はありますか?
私はforループを使ってファジーマッチングを考えました。これは、(信じられないほど遅いにもかかわらず)配列の各要素を他のすべての要素と比較することになりますが、どのようにビルドするのかは分かりません。
現在、私の配列は次のようになります。
{名前、INFO1、INFO2、情報3}
配列が数千行の長さであるので、私は、効率的なように、プログラムを作成しようとしていますできるだけ。
数千行がメモリ内にある、アレイ上で実行されているループのためにかなり速いものでなければなりません。 – grochmal
これを行う最後の試みで、それは決して終わったことはありません。私はそれが永遠に取るべきではないことに同意するので、私は間違った何かをしなければならない。私はループに取り組む方法を確信しています。 – a7xcarter