2017-08-01 2 views
0

h2o.deeplearning機能を使用してDNNを実行します。これを行うには、as.h2o関数を使用してデータをロードしました。h2o.depleplening in R、データ構造エラー

次のコードを入力して、データが正しく入力されたことを確認したところ、わずか10回しか観測されませんでした。データには、合計1,000件の観測値があります。私はas.h2o機能を使用してデータをロードしたとき

しかし、唯一の10のデータが入力されました。どの部分が間違っていますか?

これは私のRコードです。

h2o.init(nthreads = -1, max_mem_size = "5G") 
credit<-read.csv("http://freakonometrics.free.fr/german_credit.csv", header=TRUE) 
deep_credit<-as.h2o(credit,destination_frame = "deep_credit") 

h2o.str(deep_credit) 
Class 'H2OFrame' <environment: 0x0000000035bb4ad8> 
- attr(*, "op")= chr "Parse" 
- attr(*, "id")= chr "deep_credit" 
- attr(*, "eval")= logi FALSE 
- attr(*, "nrow")= int 1000 
- attr(*, "ncol")= int 21 
- attr(*, "types")=List of 21 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
    ..$ : chr "int" 
- attr(*, "data")='data.frame': 10 obs. of 21 variables: 
    ..$ Creditability     : num 1 1 1 1 1 1 1 1 1 1 
    ..$ Account.Balance     : num 1 1 2 1 1 1 1 1 4 2 
    ..$ Duration.of.Credit..month.  : num 18 9 12 12 12 10 8 6 18 24 
    ..$ Payment.Status.of.Previous.Credit: num 4 4 2 4 4 4 4 4 4 2 
    ..$ Purpose       : num 2 0 9 0 0 0 0 0 3 3 
    ..$ Credit.Amount     : num 1049 2799 841 2122 2171 ... 
    ..$ Value.Savings.Stocks    : num 1 1 2 1 1 1 1 1 1 3 
    ..$ Length.of.current.employment  : num 2 3 4 3 3 2 4 2 1 1 
    ..$ Instalment.per.cent    : num 4 2 2 3 4 1 1 2 4 1 
    ..$ Sex...Marital.Status    : num 2 3 2 3 3 3 3 3 2 2 
    ..$ Guarantors      : num 1 1 1 1 1 1 1 1 1 1 
    ..$ Duration.in.Current.address  : num 4 2 4 2 4 3 4 4 4 4 
    ..$ Most.valuable.available.asset : num 2 1 1 1 2 1 1 1 3 4 
    ..$ Age..years.      : num 21 36 23 39 38 48 39 40 65 23 
    ..$ Concurrent.Credits    : num 3 3 3 3 1 3 3 3 3 3 
    ..$ Type.of.apartment    : num 1 1 1 1 2 1 2 2 2 1 
    ..$ No.of.Credits.at.this.Bank  : num 1 2 1 2 2 2 2 1 2 1 
    ..$ Occupation      : num 3 3 2 2 2 2 2 2 1 1 
    ..$ No.of.dependents     : num 1 2 1 2 1 2 1 2 1 1 
    ..$ Telephone      : num 1 1 1 1 1 1 1 1 1 1 
    ..$ Foreign.Worker     : num 1 1 1 2 2 2 2 2 1 1 

答えて

0

これは(数日前hereを報告)H2OFrames上str()機能のプリントアウトのバグではなく、実際のバグです。これは、プリントアウトの上部にある行の正しい数を示しています

- attr(*, "nrow")= int 1000 

あなたのフレームにnrow()を使用する場合は、あなたが実際の行数が1000で表示されます。

> nrow(deep_credit) 
[1] 1000 
+0

その後、それは問題がないことを意味します、右??? as.h2o関数のエラーですか?結果として、このデータとしてh2o.deeplearning関数を使用するには問題はありませんか? –

+1

そうです。プリントアウトが間違っています(10行以上があっても常に10行と表示されるため、これを修正するバグがありました)。 'nrow(deep_credit)'や 'dim(deep_credit)'を実行することで自分でデータサイズを確認できます。 –