以下の問題を効率的に解決するアルゴリズムが必要です。 は、私は通常今、私は2つの要件があり与えられたデータからタグが来る確率を見つける
(python, django, flask, numpy),
(java, spring),
(mysql, sql, join),
(javascript, angularjs, ajax, deferred)
together.For例を来タグの組み合わせを持つタプルを持っています。
- 私は与えられたデータから異なるカテゴリを形成する必要があります。タグの新しいタグやタプルを考えると
は、私は、例えば、データ 内の他のすべての個別のタグと一緒に来て、このタグの確率を見つける必要がある:
Say new tuple is (nodejs, ajax) then the probabilities might be (nodejs, ajax) - (javascript, angularjs, ajax, deferred) - .60 (nodejs, ajax) - (mysql, sql, join) - .20 (nodejs, ajax) - (java, spring) - .20 etc
は、どのように私はこれを解決するに取り掛かる必要があります。
これらのタグがデータセットに対して完全に新しい場合、どのようにして確率を導き出すかを決める基礎がありますか? – Prune
そうですが、既存のタプルと共通のタグを持つような新しいタプルが存在します。しかし、私の最大の関心事は、タグが一緒に来る確率を見つけることです。 –
なぜ質問が投票されたのか分かりません。質問を投票する前に理由が与えられた方が良いでしょう。それは作者が欠点を理解するのに役立ちます。 –