1
as.h2o
関数を使用してRデータからh2oデータに変換しようとしました。as.h2oからのオブジェクトは、少し観察しているR
しかし、as.h2o
関数によって形質転換観測の数が自分のデータ1,000観測値の合計があります10
に低減されます。 700列車のデータと300のテストデータがあります。しかし、as.h2o
関数を使用すると、10の観測値しかありません。
以下は私の完全かつオープンソースのコードです。あなたはそれを使うことができます。私を助けてください。
なぜh2oデータに変換されたデータに10の観測値がありますか?
install.packages("h2o")
library(h2o)
h2o.init(max_mem_size = "10G", nthreads = -1)
df<-read.csv("http://freakonometrics.free.fr/german_credit.csv", header=TRUE)
F=c(1,2,4,5,7,8,9,10,11,12,13,15,16,17,18,19,20,21)
for(i in F) df[,i]=as.factor(df[,i])
library(caret)
set.seed(1000)
intrain<-createDataPartition(y=df$Creditability, p=0.7, list=FALSE)
train<-df[intrain, ]
test<-df[-intrain, ]
str(train)
str(test)
h2o_train<-as.h2o(train, destination_frame = "h2o_train")
h2o_test<-as.h2o(test, destination_frame = "h2o_test")
str(h2o_train)
str(h2o_test)
これはプリントアウトのバグです。サイズを検証するには 'nrow(h2o_train)'を見てください。私はここにバグレポートを提出しました:https://0xdata.atlassian.net/browse/PUBDEV-4742 –