1
私は多くの観測値と多くの変数を持つデータセットを持っています。しかし、いくつかの変数は、ほんの数回の観察のための実際の値を持っています。 500回未満の観測値を持つ変数を削除するにはどうすればよいですか?多くの観測値を持つ列を選択
私はdplyr
のコンテキストでこれを行う方法を見つけようとしていますが、select()
はそのようには動作しません。
これは非常にいずれかの意味がありませんが、それは私が考えてきた方向です:
dat[,sum(!is.na) > 500]
とを使用することができます「NA」のカウント数? –
'dat [、colSums(!is.na(dat))> 500]'おそらく – Frank
@Frankのようなサブセットを試してみてください。ありがとう! – Hatshepsut