2017-06-01 8 views
1

私はh2oバージョン3.10.4.8を使用しています。H2Oの混乱マトリックスの解釈方法は?

library(magrittr) 
library(h2o) 

h2o.init(nthreads = -1, max_mem_size = "6g") 

data.url <- "https://raw.githubusercontent.com/DarrenCook/h2o/bk/datasets/" 

iris.hex <- paste0(data.url, "iris_wheader.csv") %>% 
    h2o.importFile(destination_frame = "iris.hex") 

y <- "class" 
x <- setdiff(names(iris.hex), y) 


model.glm <- h2o.glm(x, y, iris.hex, family = "multinomial") 

preds <- h2o.predict(model.glm, iris.hex) 

h2o.confusionMatrix(model.glm) 
h2o.table(preds["predict"]) 

これはh2o.confusionMatrix(model.glm)の出力です:

Confusion Matrix: vertical: actual; across: predicted 
       Iris-setosa Iris-versicolor Iris-virginica Error  Rate 
Iris-setosa    50    0    0 0.0000 = 0/50 
Iris-versicolor   0    48    2 0.0400 = 2/50 
Iris-virginica   0    1    49 0.0200 = 1/50 
Totals     50    49    51 0.0200 = 3/150 

、それは全体の言うので:予測、私はモデルがIris-ある50(0 + 48 + 2)の予測を行ったことを意味するためにこれを解釈しますバーシカラー

これはh2o.table(preds["predict"])の出力です:

  predict Count 
1  Iris-setosa 50 
2 Iris-versicolor 49 
3 Iris-virginica 51 

これは、モデルがアイリス-versicolorのある49個の予測をしたことを私に伝えます。

混同行列に間違ったラベルが付けられているか、結果を解釈するのに間違いをしましたか?

+0

実際のラベルは縦(行名)、予測ラベルは横(列名)です。それはちょっと混乱しますが、エラーレートを見て、それはまったく別の意味で意味がありません – HubertL

答えて

0

あなたは間違いをしませんでした。ラベルは混乱しています(行と列が切り替わったと考える人々に思い出させる)。これはfixed recentlyで、H2Oの次のリリースに含まれます。

2

行名(縦)は実際のラベルです。

列名(横)は予測されるラベルです。