2017-07-26 9 views
1

as.h2o関数を使用してRデータからh2oデータに変換しようとしました。as.h2oからのオブジェクトは、少し観察しているR

しかし、as.h2o関数によって形質転換観測の数が自分のデータ1,000観測値の合計があります10

に低減されます。 700列車のデータと300のテストデータがあります。しかし、as.h2o関数を使用すると、10の観測値しかありません。

以下は私の完全かつオープンソースのコードです。あなたはそれを使うことができます。私を助けてください。

なぜh2oデータに変換されたデータに10の観測値がありますか?

install.packages("h2o") 
library(h2o) 
h2o.init(max_mem_size = "10G", nthreads = -1) 

df<-read.csv("http://freakonometrics.free.fr/german_credit.csv", header=TRUE) 
F=c(1,2,4,5,7,8,9,10,11,12,13,15,16,17,18,19,20,21) 
for(i in F) df[,i]=as.factor(df[,i]) 

library(caret) 

set.seed(1000) 
intrain<-createDataPartition(y=df$Creditability, p=0.7, list=FALSE) 
train<-df[intrain, ] 
test<-df[-intrain, ] 
str(train) 
str(test) 

h2o_train<-as.h2o(train, destination_frame = "h2o_train") 
h2o_test<-as.h2o(test, destination_frame = "h2o_test") 
str(h2o_train) 
str(h2o_test) 

答えて

1

これはstr()ではなく、実際の問題よりも、H2OFramesを表示する方法の風変わりであるように思われます。 Flow(localhost:54321)を参照するか、h2oオブジェクトのnrow()を呼び出すと、予想される結果が表示されます。

+0

これはプリントアウトのバグです。サイズを検証するには 'nrow(h2o_train)'を見てください。私はここにバグレポートを提出しました:https://0xdata.atlassian.net/browse/PUBDEV-4742 –

関連する問題