パッケージまたは他のパッケージを使用して、を除いて、ID
を除いた完全な観測数を表示しようとしています。はNA以外の値を数え、変数でグループ化する
NA値を除外するのにna.omit
を使用すると、完全にゼロになる可能性のあるすべてのIDが失われます。最後に
、私は2つの列を持つ周波数テーブルたい:私は私自身の機能z
作成しようとするとID
とNumber of Complete Observations
> length(unique(data$ID))
[1] 332
> head(data)
ID value
1 1 NA
2 1 NA
3 1 NA
4 1 NA
5 1 NA
6 1 NA
> dim(data)
[1] 772087 2
を - 非NA値をカウントしてのそれを適用するにはaggregate()
機能では、完全な観測値がゼロのIDは除外されます。 323ではなく332の行を残す必要があります。これは基本関数を使ってどのように解決しますか?これを行う方法の
z <- function(x){
sum(!is.na(x))
}
aggregate(value ~ ID, data = data , FUN = "z")
> nrow(aggregate(isna ~ ID, data = data , FUN = "z"))
[1] 323
データをdput()できますか? – mkt
すてきな解決策ではありませんが、すべてのNA値を 'value'変数にはない数値(たとえば0または9999999)に設定することができます。その行にその番号がない観測数を数えます。それらの数字をすべてNAに戻します。 – Marcel10
'complete.cases'はパッケージではない関数です – Sotos