2017-07-25 8 views
0

私はIDとそのような他の変数のリストとデータフレームを持っている:各グループIDの変数の平均(または合計、カウントなど)を取得するにはどうすればよいですか?

Student_ID  Score 
6    94 
2    63 
6    100 
7    44 
6    97 
2    67 

私はちょうどSTUDENT_IDと、このような平均スコアで構成され、別のデータフレームを作成したいと思います:

Student_ID  Avg_Score 
2    65 
6    97 
7    44 

もちろん、実際のデータセットはかなり大きいです。

答えて

1

あなたはdplyrパッケージを使用することができます

df %>% group_by(Student_ID) %>% summarise(Avg_Score = mean(Score)) 


# # A tibble: 3 x 2 
# Student_ID Avg_Score 
#  <int>  <dbl> 
# 1   2  65 
# 2   6  97 
# 3   7  44 

ます。また、ベースRにaggregateを使用することができます。

aggregate(Score ~ Student_ID, df, mean) #column name will remain as "Score" 

# Student_ID Score 
# 1   2 65 
# 2   6 97 
# 3   7 44 
+0

あなたが '' sum'や 'count'または他の機能とのmean'を置き換えることができます。 – Masoud

関連する問題