2017-11-15 5 views
-1

私は、スコアのリストとスコアに対応する名前の両方を持つデータフレームを持っています。一部の人は複数回出演していますが、私は各人から最高のスコアを取りたいと思っています。データフレームのサンプルを以下に示します。Rの文字列の一致と削除

 V1   Names 
1574 98.76  Lebron James    
1587 98.33  Lebron James    
1588 97.32  Lebron James    
1713 65.97  Dwyane Wade    
1730 100.4  Chris Paul    
1734 98.38  Chris Paul 

だから、私のデータフレームの最終的な形で、すべての行は、行1574、1713、および1730(各個人のための最高のスコアを維持する)を除いて削除されます。このような問題をコーディングする最善の方法は何ですか?

答えて

0

tidyverseを用いたアプローチは次のようになります変数V1に機能maxを使用してNames可変summarizeによってグループをグループ化した後

library(tidyverse) 

df %>% 
    group_by(Names) %>% 
    summarise(maxd = max(V1)) 

と新しい変数の基地Rでmaxd

を呼び出すこと保存:

aggregate(V1 ~ Names, data = df, max) 
+0

ありがとうございます!私が探していたもの –

関連する問題