私はいくつかのテキスト(例:100)を持っています。テキストグループから最もユニークなテキストを取得
私はそれらの中で最もユニークな10を保ちます。私は100x100マトリックスを作って、それぞれのテキストをLevenshteinアルゴリズムと比較しました。
最もユニークな10個のアルゴリズムを選択するアルゴリズムはありますか?
EDIT:
何私がしたいことは関係なく、私のセットの第一の要素のこのNテキストの間の距離を最大化N最もユニークなテキストです。
私はこれらのテキストをウェブに公開するため、最もユニークなものを求めています。私は近くの複製を避けたいと思います。
はい、あなたは正しいです、質問が編集されました。 – Ricardo