私は、このデータセットを与えられています

を得る最大の情報を提供する最高の機能を取得します。私は手動でやっていた。しかし、Sklearnや他のライブラリを使って計算する方法はありますか？私は、このデータセットを与えられています

ちょうど私がこのコードを書いていた参考のために：

false_count=0.0; 
true_count=0.0; 
total=0.0; 
for x in range(0, len(y_train)): 
    if y_train[x]==2: 

       false_count=false_count+1; 
       total=total+1; 

    else: 

      true_count=true_count+1 
      total=total+1 

Entropy = -(true_count/total)*(math.log((true_count/total))/math.log(2))-(false_count/total)*(math.log((false_count/total))/math.log(2))

出典

2017-10-05 Hannah Montanna

特徴選択のためのライブラリで利用可能なすべてのリソースを説明しScikit-を学ぶドキュメント内pageがあります。

あなたのデータセットでは、分類の問題があることを理解しています。つまり、は機能の選択に役立ちます。

出典

2017-10-05 12:28:42 eqperes

あなたはエントロピー損失を計算する場合、sklearnは機能metrics.log_lossがあり、official documents：の使用例：

log_loss(Y_Truth, Y_predicted, normalize=True)

出典

2017-10-05 13:05:11 chrisckwong821

私は、このデータセットを与えられています

答えて

関連する問題