2017-09-17 6 views
1

私はHotel_Nameして、新しいテーブルの各ホテルやグループ、それらをのための第1のスコアと最後の得点との違いを知りたいのですが、次のデータセット2つの値を別の行に控除し、別の変数にグループ分けするにはどうすればよいですか?

Month Year Hotel_Name Reviewer_Score 
8  2015 ambassador   7.711111 
9  2015 ambassador   8.400000 
12  2015 ambassador   9.457890 
2  2016 ambassador   8.398733 
4  2015 nh hotel   8.934023 
7  2015 nh hotel   7.345532 
11  2015 nh hotel   6.893445 
1  2016 nh hotel   8.834923 

を持っています。

答えて

1

私はあなたが最初と最後のスコアの違いたかったのかどうかわからなかった最初の

について

- - (最小値、最大値による)(日付別、最新の最も初期)、または最初と最後のスコアを

そして第二に

ans2 <- df %>% 
     group_by(Hotel_Name) %>% 
     summarise(Diff = max(Reviewer_Score) - min(Reviewer_Score)) 

# A tibble: 2 x 2 
    # Hotel_Name  Diff 
     # <fctr> <dbl> 
# 1 ambassador 1.746779 
# 2 nh_hotel 2.040578 

あなたのデータのための

library(dplyr) 
library(lubridate) 
ans1 <- df %>% 
     group_by(Hotel_Name) %>% 
     arrange(Hotel_Name, parse_date_time(paste(Month, Year), "my")) %>% 
     summarise(Diff = abs(last(Reviewer_Score) - first(Reviewer_Score))) 

# A tibble: 2 x 2 
    # Hotel_Name  Diff 
     # <fctr> <dbl> 
# 1 ambassador 0.687622 
# 2 nh_hotel 0.099100 

df <- read.table(text="Month Year Hotel_Name Reviewer_Score 
8  2015 ambassador   7.711111 
9  2015 ambassador   8.400000 
12  2015 ambassador   9.457890 
2  2016 ambassador   8.398733 
4  2015 nh_hotel   8.934023 
7  2015 nh_hotel   7.345532 
11  2015 nh_hotel   6.893445 
1  2016 nh_hotel   8.834923", header=TRUE) 
+0

ありがとう@CPakと申し訳ありません!!私は日付で最初と最後のスコアの違いを尋ねています! –

+0

これで問題が解決した場合は、受け入れることを検討してください(左側のチェックマーク) – CPak

関連する問題