2017-03-27 19 views
0

私は私のデータの素敵なジッタプロットを持っていますが、私は/中央値などの平均/合計を見つけることによって、データの中に、さらに見て探しています...検索平均/列の合計値

私は「ドンデータを列の値で区切る構文を理解しています。私が使用した年(2010年から2017年)とフォロワー(数値)

コード:

私の日付枠が2つの変数で構成されてい

ggplot(MyData, aes(factor(Date), Followers)) + 
    geom_jitter(aes(color = factor(Date))) 

これは毎年の分類グループに各数値データ・ポイントを分離しました。

私はsum(MyData$Followers)を使用して、全年で合計フォロワーを得ることができました。 count(MyData, 'Date')各年の頻度を取得する。

しかし、それらを組み合わせて、個々の年ごとにフォロワー/平均フォロワーを得る方法がわかりません。

答えて

0

あなたはdplyr使用することができます応答のための

df <- MyData %>% 
    group_by(Year) %>% 
    summarize(Mean = mean(Followers), Count = n(Followers)) 
+0

感謝を!私はまだグループ平均/合計の代わりに合計/平均を持っています。どんな考え? –

+0

'dput(MyData)'の結果をあなたの質問に投稿できますか?あなたのデータセットが本当に大きければ、2番目の数字が少なくとも2年目を含むインデックスであることを確認するだけで、 'dput(MyData [1:x])'を行うことができます – tbradley

+0

ああ、 "n_distinct "の代わりに" n "とそれを修正しました。 :) –