データベーステーブルには約1000件のレコードがあります。記事のタイトルを格納するために使用されるtitle
という列があります。レコードを挿入する前に、そのテーブルに似たタイトルの記事がすでに存在するかどうかを確認する必要があります。もしそうなら、私はスキップします。英語の文章とデータベースに格納された英語文のあいまい一致
この種のファジーマッチングを実行する最も速い方法は何ですか?文中のすべての単語が英語の辞書にあると仮定します。文#1の中の単語の70%が文#2で見つけられる場合、それらは一致とみなされます。理想的には、アルゴリズムは、各センテンスの値を事前計算して、その値をデータベースに格納できるようにすることができます。