0

私は楽しみのためだけに個人的なプロジェクトに取り組んでいます。ときに私26%、女性10%が、今私は何をしたいのか、16%Age_30-35 40%など人口統計に基づいてユーザーを分類する

と結婚したドイツ74%の男性がある

:基本的に私は次のようにそれぞれの国についての人口統計情報を持っているデータを収集しています新しいユーザーを取得するには、そのユーザーの国を確認し、ユーザーに関する情報を予測します。つまり、ユーザーが30-35歳の男性である場合(単なる例)です。

私はこのような予測をどうやって作ることができますか?国が50%以上の男性であれば、この国の新しいユーザーも男性であるというルールを作ることはできません。基本的には、ユーザーの人口統計を確実に予測するのに役立つ価値をどうやって決めることができるのかを知りたい。

答えて

1

これは実際の予測ではなく、説明されている値があればすべての確率を計算することができる確率の問題です。

P(Male|Married|30-35) = p(Male) * p(Married) * p(30-35) 
P(Male|Married|30-35) = 0,74 * 0,16 * 0,40 = 0,04736 ~ 4,7% 

Male population = 74% 
People married = 16% 
People between 30-35 = 40% 

では、次のない男性、結婚して30〜35歳の間であることが新たにドイツのユーザーのための確率を取得するには:ここで

は一例ですこれを計算するのにもっと必要はありません。しかし、すべてのユーザーを自動的に分類したい場合は、Naive Bayes Classificationをご覧ください。

+0

ありがとうございます。それは役に立ちました。 – user2175104

関連する問題