2017-10-05 9 views
0

を得る最大の情報を提供する最高の機能を取得します。私は手動でやっていた。しかし、Sklearnや他のライブラリを使って計算する方法はありますか?私は、このデータセットを与えられています

ちょうど私がこのコードを書いていた参考のために:

false_count=0.0; 
true_count=0.0; 
total=0.0; 
for x in range(0, len(y_train)): 
    if y_train[x]==2: 

       false_count=false_count+1; 
       total=total+1; 

    else: 

      true_count=true_count+1 
      total=total+1 

Entropy = -(true_count/total)*(math.log((true_count/total))/math.log(2))-(false_count/total)*(math.log((false_count/total))/math.log(2)) 

答えて

1

特徴選択のためのライブラリで利用可能なすべてのリソースを説明しScikit-を学ぶドキュメント内pageがあります。

あなたのデータセットでは、分類の問題があることを理解しています。つまり、​​は機能の選択に役立ちます。

0

あなたはエントロピー損失を計算する場合、sklearnは機能metrics.log_lossがあり、official documents: の使用例:

log_loss(Y_Truth, Y_predicted, normalize=True) 
関連する問題