2016-06-30 3 views
-1

プレーヤーの名前と実行が繰り返されるクリケットデータのサブセット。私の質問は、合計で5000以上の得点を獲得したプレーヤーの数です。それらの人々のサブセットを彼らのランと一緒に形成する。データは以下の通りです。データの概要を以下に示します。繰り返しの名前を持つデータのサブセット

"Player" "Runs"--- 
SM Gavaskar 28 
SS Naik 18 
AL Wadekar 67 
GR Viswanath 4 
FM Engineer 32 
BP Patel 82 
ED Solkar 3 
S Abid Ali 17 
S Madan Lal 2 
S Venkataraghavan 1 
BS Bedi 0 
SM Gavaskar 20 
SS Naik 20 
GK Bose 13 
AL Wadekar 6 
GR Viswanath 32 
FM Engineer 4 
BP Patel 12 
AV Mankad 44 
ED Solkar 0 
S Abid Ali 6 
S Madan Lal 3 
SM Gavaskar 36 
ED Solkar 8 
AD Gaekwad 22 
GR Viswanath 37 
BP Patel 16 
S Abid Ali 
KD Ghavri 
M Amarnath 
FM Engineer 
S Madan Lal 
S Venkataraghavan 
SM Gavaskar 65 
FM Engineer 54 

お勧めします。 excelでは重複を削除してsumifを適用しました。 Rではいかがですか?

+0

プレイヤーごとにランを合計したいと思っていますが、重複は何ですか? – Sumedh

+0

はいsumedh、私は各プレーヤーの合計ランが必要です..重複する意味Gavaskarは、他の試合でいくつかの実行を持っているので、我々は彼のすべての実行を追加する必要があります。 –

答えて

1

Excelのcsvファイルにデータがあると仮定すると、 'player'という名前の最初の列はプレーヤを表し、2番目の列は 'run'という名前のランを表します。

dat <- read.csv("cricket.csv", header=TRUE) # read in the data 
dat.nodup <- tapply(dat$runs, dat$player, function(x) sum(x, na.rm=TRUE)) # sum runs for each player with duplicate observations 
dat.gt5000 <- dat.nodup[which(dat.nodup > 5000)] # keep only records with > 5000 runs 
length(dat.gt5000) # Number of players with > 5000 runs 
+0

こんにちはカイル、問題は、プレイヤーが繰り返しているので、最初に各プレーヤーの合計を計算する必要があります。それから、上記のコマンドを実行することができます。 –

+0

こんにちはカイル、答えてくれてありがとう、私はあなたのコマンドを使用してデータから5000回を超えて合計11回走っています。ありがとうございます 。 –

関連する問題