グループを欠損値で表示するDplyr

私は、重複している大きなデータフレーム（≈2M観測値）を持っています。私はそれらの重複を削除するつもりですが、重複していない値を、欠落していない別の値（NA）を条件として保持する必要があります。それは、非NAがある限り、想像できるどんな値でもよい。例：グループを欠損値で表示するDplyr

data <- airquality 
data[4:10,3] <- rep(NA,7) 
data[1:5,4] <- NA 

library(dplyr) 

new.data <- data %>% 
    group_by(Ozone) %>% 
    filter(Wind==????))

ここでは、「風== ????」という注釈を付けてフィルタリングする内容がわかりません。任意の値（数値または公称値）がWind列にある限り、これらの一意の値を保持し、欠損値以外の条件付き値を削除したいと考えています。

ありがとうございました！

出典

2017-06-12 Starbucks

あなたが 'データ％>％GROUP_BY（オゾン）％>％フィルタ（！重複（風）＆！is.na（風））たかったを行うことができます' – akrun

があなたをありがとう助けて – Starbucks

我々は

data %>% 
    group_by(Ozone) %>% 
    filter(!duplicated(Wind) & !is.na(Wind))

出典

2017-06-12 19:39:29 akrun

グループを欠損値で表示するDplyr

答えて

関連する問題