2009-07-30 8 views
1

で簡単に関連する記事のアプリケーションを構築するためにそこの方法です/ pythonこれは、ユーザーの入力を受け取り、元の入力と密接に一致する関連するポストを出力します。私は同じようなステートメントを使ってみましたが、十分に敏感ではないようです。は、私はジャンゴで「関連記事」アプリのための解決策を考え出すことができない、過去4週間のための私の悪夢をすることによってようだ</p> <p>ジャンゴ

私は、これも考慮に入れるためにタイプミスが必要なものです。

私の苦痛と苦しみから私を救うライブラリがありますか?

答えて

2

私は、ユーザ入力を正規化して望ましい結果を得るためのいくつかの方法があると思いますが(ライブラリがどれだけ存在するかはわかりませんが)関連する投稿を取得する最も簡単な方法の1つは、その投稿に存在するタグを比較することです(投稿にタグが付与されていることが条件です)。あなたが別のルートに行きたいなら、私は次のステップを踏みます:stemmerを残して、サブジェクトからstop wordsを取り除き、最後に残りの単語を「タグ」として扱い、他の投稿と比較します。効率を上げるために、現在のすべての投稿のバッチ処理でこれらのステップを実行し、その結果の「タグ」を保存することをお勧めします。私が試した限りでは、スペルチェッカーのライブラリが多数存在すると確信しています(Googleと数秒後にthis oneが見つかりました)。