私はLuceneによって索引付けされる記事のデータベースを持っていますが、ユーザーのタグとmahoutで分類されます。記事には一定のスコアが付けられます(ユーザーはタグに同意または同意できません。マハウトで発見されたタグはユーザーのものと同じ扱いになります)。Mahoutでフルテキストのパーソナライズ検索
プロフィールやインタラクション履歴からユーザーの関心(特定のタグに興味があるかもしれません)を調べたいと思います。
ユーザーの興味をどのように保存できますか?
ユーザーの興味を使って検索結果を並べ替えたりフィルタリングしたりするにはどうすればよいですか?
私のアプローチは可能ですか?実現可能か?スケーラブル?
どのような技術とアルゴリズムを使用できますか?提案してください!
あなたの答えをありがとう。私は興味のある新しいタグを示唆することにあなたのポイントを持っています。しかし、検索結果の並べ替えやフィルタリングのための意味のある情報を出力するための入力として、記事の分類とユーザーの関心を受け付けるアルゴリズムはありますか? –
記事に関連するタグと、ユーザーに関連するタグを知っている場合、これは簡単な検索問題です。指定されたユーザーと最も重複する項目を返します。対数尤度類似度メトリックを使用することもできますが、それはMahoutにあります。 –