私は、格付け欄に格付けの条件付き確率( 'A'、B '、' C ')を計算したいと考えています。データフレームpandas-pythonの値の条件付き確率を計算するには?
company model rating type
0 ford mustang A coupe
1 chevy camaro B coupe
2 ford fiesta C sedan
3 ford focus A sedan
4 ford taurus B sedan
5 toyota camry B sedan
出力:
Prob(rating=A) = 0.333333
Prob(rating=B) = 0.500000
Prob(rating=C) = 0.166667
Prob(type=coupe|rating=A) = 0.500000
Prob(type=sedan|rating=A) = 0.500000
Prob(type=coupe|rating=B) = 0.333333
Prob(type=sedan|rating=B) = 0.666667
Prob(type=coupe|rating=C) = 0.000000
Prob(type=sedan|rating=C) = 1.000000
すべてのヘルプ、感謝..!
も、ちょうどそれを行う:)。 Prob(タイプ=クーペ|レーティング= A)= Prob(タイプ=クーペとレーティング= A)/ Prob(レーティング= A)。 – cel