2017-03-03 10 views
0

申し訳ありませんが、私は戻ってきました。今回は私に再現可能な例をもたらしました。サブセット化で作成されたファントムNAレコード

fileURL <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Fss06hid.csv" 
download.file(fileURL, destfile = "./acs.csv") 
acs <- read.csv("./acs.csv") 
mySubset <- acs[acs$ACR == 3 & acs$AGS == 6, ] 

は私がmySubsetで見ることを期待すると、その条件を満たしている6496のうち77のレコードです。しかし、私が最終的に私の77の期待レコードと1,036の予期しないレコードは完全にすべての列のNAです。

私はここで何を理解していませんか?

+2

mySubset < - acs [(ACS $ ACR == 3&acs $ AGS​​ == 6)、]を試してください ' – G5W

+0

これは良い解決策です。私はちょうどだった!is.na() - ランダムな列でそれは私が起こっていたことに従っていなかったナットを運転していたようなものだった。 –

答えて

1

再現例:フィルタのデフォルトNASに全行の基本的

df <- data.frame(a=c(NA, 1, 2 ,3), b = c("a", "b", "c", "d")) 
df[c(NA, TRUE, FALSE, FALSE), ] 
#  a b 
# NA NA <NA> 
# 2 1 b 

NA

この動作を修正するには、is.na(df$a)を使用して欠損値を確認します。

関連する問題