2017-12-09 9 views
-3

私は、異なる国の映画(「映画」「国」の列)と世界中の評価(列「評価」)のムービーに関するデータセットを持っています。各国に複数の映画があることを考慮して、各国の格付けの平均を見つけるにはどうすればよいですか?数値データの複数の列(「評価」)を持つ各変数(クラス「文字」)の平均を見つけるにはどうすればよいですか?

+2

[mcve]を確認してください。 –

答えて

1

データ形式が正しい場合は、このようなものが動作するはずです。

require(data.table) 
# create test data set, you can use setDT to create data.table from data.frame 
set.seed(123) 
dt <- data.table(movies=rep(c("Movie 1", "Movie 2", "Movie 3"), 3), 
country=rep(c("US", "UK", "IE"), each=3), rating=sample(9)) 
# movies country rating 
#1 Movie 1  US  3 
#2 Movie 2  US  7 
#3 Movie 3  US  9 
#4 Movie 1  UK  6 
#5 Movie 2  UK  5 
#6 Movie 3  UK  1 
#7 Movie 1  IE  2 
#8 Movie 2  IE  8 
#9 Movie 3  IE  4 

# calculate average rating 
dt[, .(rating = mean(rating)), by = country] 
関連する問題