2017-07-30 11 views
1

マイランダムフォレストモデルコードがで締めくくら:精度、精度、F1などの2つの数値はどういう意味ですか?

print('\nModel performance:') 
performance = best_nn.model_performance(test_data = test) 
accuracy = performance.accuracy() 
precision = performance.precision() 
F1  = performance.F1() 
auc  = performance.auc() 
print(' accuracy.................', accuracy) 
print(' precision................', precision) 
print(' F1.......................', F1) 
print(' auc......................', auc) 

と、このコードは次のように出力生成:

Model performance: 
    accuracy................. [[0.6622929108639558, 0.9078947368421053]] 
    precision................ [[0.6622929108639558, 1.0]] 
    F1....................... [[0.304835115538703, 0.5853658536585366]] 
    auc...................... 0.9103448275862068 

なぜ私は正確さ、精度、F1のための2つの数値を取得していますが、彼らは何を意味しています?

チャールズ

PS:私の環境は次のとおりです。

H2O cluster uptime:   6 mins 02 secs 
H2O cluster version:  3.10.4.8 
H2O cluster version age: 2 months and 9 days 
H2O cluster name:   H2O_from_python_Charles_wdmhb7 
H2O cluster total nodes: 1 
H2O cluster free memory: 21.31 Gb 
H2O cluster total cores: 8 
H2O cluster allowed cores: 4 
H2O cluster status:   locked, healthy 
H2O connection url:   http://localhost:54321 
H2O connection proxy: 
H2O internal security:  False 
Python version:    3.6.2 final 
+0

おそらく、およびテストデータの両方が含まれます。精度とf1と同じです。しかし、私は確信していません。 –

答えて

1

二つの数がしきい値をそれぞれそのメトリックの値です。しきい値が決定されると、accuracyまたはprecisionのメトリックを計算できます。

model.confusion_matrix()を使用すると、使用されたしきい値がわかります。

たとえば、バイナリ分類では、「しきい値」は、予測クラスラベルが何であるかを決定する値(0と1の間の値)です。モデルが特定のテストケースに対して0.2を予測し、しきい値が0.4である場合、予測クラスラベルは0になります。しきい値が0.15だった場合、予測クラスラベルは1になります。

関連する問題