特定のレベルの変数の平均値を決定するR

異なる変数を割り当てたレベルに固有の変数の平均値（平均）を求めようとしています。特定のレベルの変数の平均値を決定するR

これまでのところ、私はそれに関連する様々なレベルで新しい変数を作成した（レベル1 =値< = 0％、レベル2 =値< 1％、および> = 1％レベル3 =値。

pincome$income_growth <- ifelse(pincome$incomechng <= 0, "level 1", 
           ifelse(pincome$incomechng < 1,"level 2","level 3"))

は、今私はレベル1（所得の伸びが0％未満）のために上記のレベルに関連付けられている別の変数の平均値（例えば平均所得を決定します。

私は、これは理にかなって願って、私は非常によ初心者のRとそのハングアップを取得しようとしている！

ありがとう！

出典

2016-09-27 user6880126

私は正しい道を推測しているが、 '（DF、AVE（V、レベル））との'のようなものであるか、 '（DF、tapply（V、レベル））と'どこ 'DF'は、あなたのデータであり、 .frame、 'v'はあなたの変数、' level'はあなたのグループ変数です。詳細は、 '？ave'と'？tapply'と入力してください。 – Frank

てみby（?by）あなたはもっと複雑なことをやって起動する場合は、ベース・R.をしたい場合は、plyr/dplyrパッケージはかなり驚くべきものだ、とあなたは巨大なデータセットを周りマックしようとしている場合は、ビットを気にしません最初の学習曲線の多くは、data.tableパッケージも素晴らしいです。

reproducible exampleは素晴らしいでしょう。

など。

set.seed(1) # so your random numbers are the same as mine 
pincome <- data.frame(incomechng = runif(20, min=-1, max=3)) 

# what you had was fine too; using ?cut is another way to do it 
# have just put it in for demonstration purposes. 
# though `cut` uses intervals like (a, b] or [a, b) whereas yours 
# are (-Inf, 0] (0, 1) [1, Inf) which is a little different.  
pincome$income_growth <- cut(pincome$incomechng, 
          breaks=c(-Inf, 0, 1, Inf), 
          labels=paste("level", 1:3))

ここで、各グループ内の平均を取ることができます。私は3つの選択肢を示しました。私はもっとあると確信しています。

# base R ?by 
by(pincome$incomechng, pincome$income_growth, mean) 
# pincome$income_growth: level 1 
# [1] -0.6848674 
# ------------------------------------------ 
# pincome$income_growth: level 2 
# [1] 0.4132334 
# ------------------------------------------ 
# pincome$income_growth: level 3 
# [1] 1.772039 

# plyr (dplyr has pipe syntax you may prefer but is otherwise the same) 
library(plyr) 
ddply(pincome, .(income_growth), summarize, avgIncomeGrowth=mean(incomechng)) 
# income_growth avgIncomeGrowth 
# 1  level 1  -0.6848674 
# 2  level 2  0.4132334 
# 3  level 3  1.7720395 

# data.table 
library(data.table) 
setDT(pincome) 
pincome[, list(avgIncomeGrowth=mean(incomechng)), by=income_growth] 
# income_growth avgIncomeGrowth 
# 1:  level 2  0.4132334 
# 2:  level 3  1.7720395 
# 3:  level 1  -0.6848674

出典

2016-09-27 01:29:42

特定のレベルの変数の平均値を決定するR

答えて

関連する問題