dplyrを使って行を結合し、重複を削除し、空白も削除しようとしています。ここに私のデータフレームは、次のとおりです。重複を結合する、空白を公開しない、dplyr :: distinct
unique_id school subject grade sex
1 great Math 88
1 great English 78
1 great History 98 male
2 spring Math 65
2 spring English 72 female
2 spring History 84
私は(あなたにAkrunに感謝)を実行すると:
(r2 <- df %>%
group_by(unique_id) %>%
summarise_each(funs(toString(unique(.)))))
私が手:
unique_id school subject grade sex
1 great Math, English, History 88,78,98 , male
2 spring English, English, History 65,72,84 , female
私はブランクが含まれる場合、またはカンマはありません最後の変数では、性別。代わりに、私は次のようにそれが見てみたい:
unique_id school subject grade sex
1 great Math, English, History 88,78,98 male
2 spring English, English, History 65,72,84 female
どれ
は、凝縮した後、それを削除し、インポート時にNAを追加しようと、それは動作しませんでした。任意のアイデアをどのように行を凝縮するだけで、行の値を保持し、空白を無視?ありがとうございました。
あなたの場合コンマを使いたくないのですが、なぜ 'toString'を使っていますか? –
それは私に推奨されたものです。私はそれを置き換えることを何をお勧めしますか? – richiepop2
sex列の空の文字列を各unique_idの同じ性別で置き換えてください。 – Psidom