2011-06-20 9 views
4

私は多くの小売業者が自社の製品情報を個別にアップロードしているプロジェクトに取り組んでいます。つまり、まったく同じ製品にはさまざまな名前が付いています。たとえば、新しいipad、ipad、またはgreat ipadなど。デザインに関する質問:製品または自動ラベル製品を検索していますか? (検索とマシンラーニング)

私は直感的なインターフェースを提示して、ipadまたはipadsを検索すると、すべての価格のipadを検索結果として取得します。並置された。または、おそらく2つの検索結果、最初のものは別の小売業者からのすべての価格で古いipad、もう1つは隣の価格とipad 2の別の検索結果です。

具体例: データベースが含まれています:新しいiPad 1、iPadの1、すばらしいアプリ1、新しいiPad 2、iPadの2、すばらしいアプリを2 iPad用のユーザー検索は、彼が取得するとき:

  • ipad1:小売店の価格2 = 100 $、小売店の価格2 = 120 $など...

は、次のとおりです。小売店1 = 100 $、小売店の価格2 = 120 $など...

  • のipad2の価格これは主に検索固有の問題ですか?または機械学習、自動ラベル付け?

    そして誰もがRails3のように実装されていることを知っていますか?

    ありがとうございました

  • 答えて

    1

    重複除去問題です。地図、カタログはそれを扱っています。さまざまな成功度でこの問題に対する多くの解決策があります。 最も単純なのは、同義語や無用な単語(Great、fun)などを識別し、この情報を使って一致するアイテムを実行することです。あなたがレビューのために人間に送信する必要があるいくつかの不明確なケース。

    例「新しいApple Ipad」と「偉大なipad」とは無駄な単語を削除する=>「Apple ipad」と「ipad」は部分文字列で等しい/曖昧に=>等しい

    関連する問題