2016-04-14 8 views
0

私はばかばかしい状況に直面しています。データの問題を欠落している取り組むために、私はこのコードを使用:Rのデータが不足している場合の扱い

fixed_data <- fetch_data[-which(! complete.cases(train_sample)),] 
train_index <- sample(1:nrow(fixed_data), size = .7*nrow(fixed_data)) 
train_sample <- fixed_data[train_index, ] 
test_sample <- fixed_data[-train_index,] 

は、その後、私は何の欠損値がありませんを確認するためにポーションデータの行をチェックしますが、不足している値がまだあります!

length(which(! complete.cases(fixed_data))) 
+0

"欠落しているデータ"を定義してください、それは空白ですか、NAですか、欠落を示す他の文字列ですか?それらがNAであれば、 'is.na()'を使ってNAを含む行を見つけることができます。キャラクタのNA文字列は、私が知る限り、 'complete.cases()'によって行方不明とみなされることはありません。それは問題になる可能性があります。 – Badger

+1

関連はありませんが、 ' - (!...)'は非常に醜いです。ずっと優れているのはどちらか(...) '。データを提供する必要があります。 – nicola

+0

私はwhichを使用して、完了していないと思われるものをすべて削除していますが、そのあとではまだ他の行が不完全であるとみなします。それが問題です! –

答えて

0

私は

fixed_data <- fetch_data[which(complete.cases(fetch_data)),] 

にコードを変更し、それは今働いています。どのような愚かな間違い!

関連する問題