2016-03-21 11 views
1

私は多くの観測値と多くの変数を持つデータセットを持っています。しかし、いくつかの変数は、ほんの数回の観察のための実際の値を持っています。 500回未満の観測値を持つ変数を削除するにはどうすればよいですか?多くの観測値を持つ列を選択

私はdplyrのコンテキストでこれを行う方法を見つけようとしていますが、select()はそのようには動作しません。

これは非常にいずれかの意味がありませんが、それは私が考えてきた方向です:

dat[,sum(!is.na) > 500] 
+0

とを使用することができます「NA」のカウント数? –

+6

'dat [、colSums(!is.na(dat))> 500]'おそらく – Frank

+0

@Frankのようなサブセットを試してみてください。ありがとう! – Hatshepsut

答えて

0

我々はvapply

dat[vapply(dat, function(x) sum(is.na(x)) <=500, 0)] 

それともFilter

Filter(function(x) sum(is.na(x)) <= 500, dat) 
関連する問題