2012-04-18 9 views
0

私は1500カテゴリ(いくつかの複数の単語を含む他のいくつかの単語)の非常に大きなカテゴリテーブルを持っています、そして、私はこれらのカテゴリに新しい商品をタイトルでマッチさせる最良の方法を探しています。カテゴリマッチング - 正規表現と全文検索

私はregexを使用してキーワードの製品説明をループしていますが、これは一度に1000以上の製品を追加しようとするとあまり効率的ではありません。また、フルテキスト検索(FREETEXTとcontainsを含む)ではなく、FreeText検索では、商品説明の任意の単語とすべての単語に一致する検索結果が表示されるようです。

誰も、製品の説明でどのカテゴリを自動化しようとしている点で似たようなことをしていますか?

答えて

1

私は理解しているように、この説明がどのカテゴリに適用されるのか説明を与えられていますか?

この種の作業を行う一般的な方法は、Naive Bayesian Classificationプロセスを構築し、これを使ってすべての説明を入れることです。

このような分類は、通常2つの段階で行われます。

ステージ1:既知の記述/カテゴリのペアは、分類子を「訓練する」ために使用されます。

段階2:分類器が訓練されたら、それに未知のデータを与えることができます。そして、記述が特定のカテゴリに一致する確率を返します。

このアプローチでは、分類器は、私はナイーブベイズ分類の読み取りアップがあるでしょう、エラーは通常

+0

おかげでクリープを行い、通常はかなり正確ですが、私たちは、統計を扱っている与えられました – user1186144