2017-08-04 10 views
-5

私はそれを集めた電子メールとチャンネルのリストを持つExcelファイルを持っています。 Rを使用してチャネルごとにいくつの電子メールが複製されているかを知ることができます(別のファイルをインポートして結果を取得するたびにインポートするたびに)。Rで重複するレジスタを見つける

ありがとうございました! 「DF」のデータフレームを想定し

+0

[Rの重複値の検索](https://stackoverflow.com/questions/16905425/find-duplicate-values-in-r)の可能な複製 – user3640617

+0

回答ありがとうございます。実際、この投稿は繰り返しの電子メールの数をカウントするのに役立ちますが、各チャンネルに基づいてカウントをグループ化する方法はわかりません。 :)基本的な知識を申し訳ありません! – user8419142

+0

いくつかのRチュートリアルを進めるのが最善です。これを行うには多くの方法があります。あなたはチャンネルごとにデータを分割して重複を見つけることができます。あるいは、おそらく各チャンネルのユニークなセットとフルセットの差を計算することができます。 –

答えて

0

は、その後、該当する名前を「チャネル」の下の変数と、「電子メール」を持っている:

独自のチャネル・メールのペアの数を取得するには:

dim(unique(df[c("channel", "email")]))[1] 

へ単に、後から元を引く、重複の数を取得するには

sum(table(df$channel, df$email)) 

:すべてのチャネルのメール観測の合計を取得

sum(table(df$channel, df$email)) - dim(unique(df[c("channel", "email")]))[1] 
+0

ありがとうございます:) – user8419142

関連する問題