2012-11-12 12 views
8

aからkまでの複数の変数の時系列データを含むファイルがあります。ggplotを使用した時系列の複数変数の平均のプロット

変数a〜kの平均値を時系列以上にプロットしたグラフを作成したい場合、その平均線は毎日の最大変動と最小変動を表す平滑化領域を追加します。

信頼区間のようなものですが、平滑化されたバージョンです。ここで

は、データセットです: https://dl.dropbox.com/u/22681355/co.csv

、ここでは、私が持っているコードは、これまでのところです:

library(ggplot2) 
library(reshape2) 
meltdf <- melt(df,id="Year") 
ggplot(meltdf,aes(x=Year,y=value,colour=variable,group=variable)) + geom_line() 
+2

古いデータセットの例を教えてください。 – jackb

答えて

8

これは、ブートストラップの95%信頼区間を示している:

ggplot(meltdf,aes(x=Year,y=value,colour=variable,group=variable)) + 
    stat_summary(fun.data = "mean_cl_boot", geom = "smooth") 

ggplot smoothed bootstrap confidence

これは、彼はすべての変数+ -1SDのすべての値の平均:

ggplot(meltdf,aes(x=Year,y=value)) + 
    stat_summary(fun.data ="mean_sdl", mult=1, geom = "smooth") 

enter image description here

あなたは年が変数より手段とSDを計算する前に意味が、私はあなたにそれを残して計算する場合があります。

しかし、私は、分布が明らかに対称ではないので、ブーストラップの信頼区間がより賢明であると信じています。それはまた狭くなります。 ;)

もちろん、値をログに変換することもできます。

+0

Rolandありがとう、おそらく私は明確ではないかもしれませんが、私がしたいことは、これらの変数の平均をプロットし、信頼区間の代わりに、毎日の領域を網羅しています。毎日の平均。 – user1723765

+0

「平均の上下の変動」という言葉が何であるか分かりません。 – Roland

+0

1. a-kの平均を取って、それを毎日プロットします。 2.毎日あなたはその平均を上回るか下回るa-k変数のいくつかを持ちます。私は、その周辺にどのくらいのばらつきがあるかを示す影の付いた領域を持っていたいと思います。 – user1723765

関連する問題