2017-12-12 18 views
0

私のデータセットはhereを参照できます。要点では、平均と信頼区間をプロットする必要があるフィットという列があります。私はここで信頼区間を符号化するときにdplyrを使用して列の長さを求める方法R

data.melt$time = factor(data.melt$time, levels=paste("t", seq(0, 10), sep="")) 

私ggplotのための機能をdplyr使用して信頼区間をコードしようとしています

はコード

summary_dat = data.melt$time %>% 
       group_by(resource, fertilizer, time) %>% 
       summarise(mean_predict=mean(fitted), 
         sd_predict = sd(fitted), 
         n_predict = n(fitted)) %>% 

    mutate(se = sd_predict/sqrt(n_predict), 
     lower_ci = mean_predict - qt(1 - (0.05/2), n_predict - 1) * se_predict, 
     upper_ci = mean_predict + qt(1 - (0.05/2), n_predict - 1) * se_predict) 

ただし、Rは私がnとn_predictコーディングすることはできません(取り付けられています)。私も長さ(フィッティング)を試みたが運がなかった。何か案は?

+0

あなたのアプローチは 'length()'ではなく 'n()'ではなく、コードに小さなタイプミスがあります。最初の行は 'data.melt $ time'ではなく、データフレーム' data.melt'全体で始まり、問題の列は 'fitted'ではなく' predict'と呼ばれ、標準エラーは2つの異なる名前、 'se'と' se_predict'です。 – qdread

答えて

0

n()dplyrの便利機能は、サブセット内の1つの列の長さではなく、サブセット内の行数を数えます。引数を取らない。 n_predict = n()またはn_predict = length(predict)のいずれかを使用します。

関連する問題