2016-08-05 5 views
-2

私のデータセットは以下の通りです。私はfreadを使ってrでそれを読もうとします。しかし、列クラスはすべてcharacterです。fread()は指定された文字にすべての列クラスを割り当てます

class <- c("character", "character", "numeric", "numeric","numeric", 
"character", "numeric", "numeric", rep("chracter", 5), "numeric",          
"chracter", "character", "factor", "character",  
"character", "character", "character", "character", "factor",           
"numeric", "numeric", "character",rep("numeric", 6), "character",          
"numeric", "factor", rep("numeric", 9) , "character", "numeric",          
"character", "character", "numeric", "numeric", "numeric", "factor",         
"factor", "numeric", "numeric", "factor", rep("numeric", 55)) 

data_q1 <- fread("LoanStats_2016Q1.csv", header = TRUE, skip = 1, nrows = 133887, colClasses = class, fill = TRUE) 

str(data_q1) 

Classes ‘data.table’ and 'data.frame': 133887 obs. of 111 variables: 
$ id       : chr "75577129" "75669195" "75769072" "75991583" ... 
$ member_id      : chr "81011841" "81136933" "81236807" "81482303" ... 
$ loan_amnt      : chr "25000" "4000" "3600" "8000" ... 
$ funded_amnt     : chr "25000" "4000" "3600" "8000" ... 
$ funded_amnt_inv    : chr "25000" "4000" "3600" "8000" ... 

私はこのanswerをチェックしており、私はこれを試してみました:

any(is.na(data_q1[, loan_amnt])) 
[1] FALSE 

マイloan_amnt列がNA値が含まれていません。今私は問題が何であるか分からない。

data

+1

私はあなたがこの問題に直面していると思います: 'freadは列colClassesが要求する場合は上位の型に変換します。 NAsは結果としてカラムをより低いタイプにダウングレードしません。あなたは本当にデータ損失が必要な場合は、後でそのような列を強制する必要があります。 ' – Vedda

+0

しかし、問題はloan_amnt列にNA値がありません – zhichi

+1

' NA '値はありませんが、データセットには他のタイプの値「NA」のためにデータを持たずにこのことを知るのは難しいです。私は視覚的にすべてのデータを見て欠損値が他のものとして識別されているかどうかを確認します。 – Vedda

答えて

1

あなたは、クラスベクトルにおけるスペルの間違いを持っ​​ています。 rep( "文字"、5)はrep( "文字"、5)でなければならず、このエラーは同じベクトルで再度行われます。

関連する問題