私たちは、特定の投稿について、それが主に関連する投稿のリストを返す必要がある、投稿分析の要件を持っています。投稿の共通タグ例えば:MongoDBの2つのリストの交差を数えてソートする
postA = {"author":"abc",
"title":"blah blah",
"tags":["japan","japanese style","england"],
}
存在のようなタグを有する他の記事であってもよい。
postB:["japan", "england"]
postC:["japan"]
postD:["joke"]
ので、基本的に、postB 2つのカウントを取得ポスタのタグと比較するとき、POSTC 1カウントを取得します。 postDは0を返し、結果には含まれません。
マップ/リダクションを使用して結果を生成することを前提としていますが、map/reduceの基本的な使い方を理解していますが、この特定の目的のための解決策を見つけることはできません。
助けが必要ですか?または、カスタム仕分け機能のような優れた方法がありますか?私は現在Python開発者としてpymongodbを使用しています。