グループごとの平均を計算するR

私はいくつかの統計を計算したいデータがあります。データが私はここでP1、M1、およびR1をそれぞれ3要素のタプルにグループごとの平均を計算するR

(P1,M1,R1,V1) 
(P1,M1,R2,V2) 
(P1,M2,R1,V1) 
...

等何かに対応する値を有するように編成され、数値ではなく、V1とV2です。次のようには、今私は、CSVファイルのx2.cvsデータを持っている：

P,M,R,V 
P1,M1,R1,V1 
P1,M1,R2,V2 
...

私は

d = read.table("x2.csv", sep=",", header=TRUE)

を使用してデータを読み取るが、その後、私が処理するために、何をするか分かりませんデータ。 Pの各要素の平均は何ですか（平均はMとRのすべての要素になります）。または{Pの要素の各ペア、M}は（ので、ここでの平均は、私がP1の多くの要素がいくつか指定された値よりも大きいですかコンピューティングのようなもう少し複雑なことをしたいと思っR.

次の要素の上だろう。

出典

2012-03-21 skeept

機能BASICを試してください。その中で本当に基本的な情報を提供します。 – Oz123

私はRのチュートリアルを探しています。これは本当に基本的なものですから、ここでは大きな答えはありません。 – Oz123

'tapply'と' table'を参照してください。 –

ここに始まり、data.table、plyrと基本機能があり、他にもたくさんの方法があります。

まず、いくつかの例のデータ...

dput(examp) 
structure(list(P = structure(c(1L, 1L, 1L, 2L), .Label = c("P1", 
"P2"), class = "factor"), M = structure(c(1L, 1L, 2L, 2L), .Label = c("M1", 
"M2"), class = "factor"), R = structure(c(1L, 2L, 1L, 1L), .Label = c("R1", 
"R2"), class = "factor"), V = c(23, 49, 24, 29)), .Names = c("P", 
"M", "R", "V"), row.names = c(NA, -4L), class = "data.frame") 
# 
# to give something like what you have... 
# 
examp 
    P M R V 
1 P1 M1 R1 23 
2 P1 M1 R2 49 
3 P1 M2 R1 24 
4 P2 M2 R1 29

はここdata.tableを使用して1つの方法です。 http://datatable.r-forge.r-project.org/datatable-intro.pdf

# What is the average of each element of P? 
library(data.table) 
examp.dt <- data.table(examp) 
setkey(examp.dt,P) 
examp.dt[,mean(V),by=P] 
     P V1 
[1,] P1 32 
[2,] P2 29 
#

、別のplyr

# What is the average of each element of P? 
library(plyr) 
ddply(examp, "P", function(df)mean(df$V)) 
P V1 
1 P1 32 
2 P2 29

を使用して、別の使用してベースR

：あなたのデータオブジェクトが非常に大きい場合、あなたは非常に高速であることを data.tableパッケージを見つけることができます、ドキュメントも抜群です

# What is the average of each element of P? 
# for example using the by() function, tapply() would be similar 
with(examp, by(examp, P, mean)) 
P: P1 
P M R V 
NA NA NA 32 
------------------------------------------------- 
P: P2 
P M R V 
NA NA NA 29 
# 
# What is the average of each element of R? 
with(examp, by(examp, R, mean)) 
R: R1 
P  M  R  V 
NA  NA  NA 25.33333 
---------------------------------------------- 
R: R2 
P M R V 
NA NA NA 49 
# 
# the same, using tapply 
with(examp, tapply(V, R, mean) 
    R1  R2 
25.33333 49.00000

最後に、P1のいくつの要素が指定された値よりも大きいかを確認するため、少ないタイピングで

# how many elements of P1 are greater than 20? 
nrow(subset(examp, examp$P=="P1" & examp$V>20)) 
[1] 3

あるいは単に[同じ結果について：そうのよう

1：

nrow(examp[examp$P=="P1" & examp$V>20,]) 
[1] 3

出典

2012-03-21 07:28:54 Ben

aggregate機能は、おそらくあなたが求めているものを使用するのが最も簡単です）Pの各要素の平均は？

aggregate(formula = V ~ P, data = d, FUN = mean)

2）または{P、M}の要素の各ペアのために？P1の

aggregate(formula = V ~ M + R, data = d, FUN = mean)

3）どのように多くの要素がいくつか指定された値より大きいですか？

aggregate(formula = V ~ P, data = d, FUN = function(x)sum(x > 10))

出典

2012-03-21 10:55:19 flodel

グループごとの平均を計算するR

答えて

関連する問題