2017-08-10 19 views
0

Rでポアソン分布の百分位数を取得してプロットするにはどうすればよいですか?基本的には、x軸に年(つまりyr)、y軸に線としてポアソン分布の50パーセンタイル(中央値)を示すプロットを作成したいと考えています。私のサンプルデータとスクリプトは以下の通りです。Rのポアソン分布のパーセンタイルをプロットする方法は?

dt<-structure(list(yr = 1979:2008, cn = c(9, 15, 17, 11, 9, 10, 8, 
10, 18, 12, 11, 14, 12, 16, 10, 13, 9, 9, 11, 11, 14, 14, 10, 
11, 14, 15, 14, 12, 9, 12), `inn` = c(1.12666666666667, 1.35666666666667, 
-0.0533333333333333, -0.166666666666667, 0.213333333333333, -0.0533333333333333, 
-1.32, 0.0633333333333333, -0.22, 0.01, -0.456666666666667, -1.01, 
-0.326666666666667, 0.0233333333333334, -0.496666666666667, -1.24, 
0.2, -0.46, 0.32, 0.63, 0.466666666666667, -0.0233333333333333, 
0.33, 0.503333333333333, 0.0566666666666667, -0.396666666666667, 
0.58, -0.596666666666667, 0.98, 1.01666666666667)), .Names = c("yr", 
"cn", "inn"), row.names = c(NA, -30L), class = c("grouped_df", 
"tbl_df", "tbl", "data.frame"), vars = "yr", drop = TRUE, indices = list(
0L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 
14L, 15L, 16L, 17L, 18L, 19L, 20L, 21L, 22L, 23L, 24L, 25L, 
26L, 27L, 28L, 29L), group_sizes = c(1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L), biggest_group_size = 1L, labels = structure(list(
yr = 1979:2008), row.names = c(NA, -30L), class = "data.frame", vars = "yr", drop = TRUE, .Names = "yr")) 

model=glm(dt$cn~dt$inn, family=poisson(link=log)) 
summary(model) 
model$fitted 

## create the plot 
P<-ggplot(dt, aes(x = yr)) + 
    geom_point(aes(y = cn)) 
P 
+0

どのようにプロットしますか?別の色のドットが好き...それらの手段を結ぶ線? –

+0

glm関数は中央値を推定しません。分位回帰を使用する必要があるかもしれません。あなたのプロットはモデルに入る独立変数ではなく "Y値"しか持たないので、あなたがモデルを使って何をしようとしているのかも不明です。 「X値」の中央値で予測を使用する予定ですか? –

答えて

1

私は次は、ご希望のコードデータで

# prepare a single dataframe containing all the information 
dataPlot = data.frame(x = dt$yr # x values 
         , y = dt$cn # y points 
         , q875 = qpois(0.875, model$fitted) # upper bound of 75% confidence interval 
         , q625 = qpois(0.625, model$fitted) # upper bound of 25% confidence interval 
         , q50 = qpois(0.50, model$fitted) # median 
         , q375 = qpois(0.375, model$fitted) # lower bound of 25% confidence interval 
         , q125 = qpois(0.125, model$fitted) # lower bound of 75% confidence interval 
      ); 

# create the plot object 
P <- ggplot(dataPlot, aes(x = x),) + # add data and set x-axis 
      geom_ribbon(aes(ymin=q125, ymax=q875), fill = "gray") + # color the area of 75% confidence interval (the area is colored between `ymin` and`ymax` - see ?geom_ribbon 
      geom_ribbon(aes(ymin=q375, ymax=q625), fill = "lightgray") + # color the area of 25 confidence interval 
      geom_point(aes(y = y)) + # add the points 
      geom_line(aes(y = q50)) # add median lines 
# and plot it 
P 

帯域幅であるが、2つの直線長方形で、以下の通常のランダムなデータを使用して、あるプロットを見てみましょうすると思いますあなたの画像プロットより似て

m = rexp(NROW(dt), rate=2) # generate random means 
s = rexp(NROW(dt), rate=5) # generate random standard deviations 
dataPlot = data.frame(x = dt$yr # your x-values 
        , y = rnorm(NROW(dt), mean=m, sd=s) # random y-values 
        , q875 = qnorm(0.875, mean=m, sd=s) # from now on, see previous comments 
        , q625 = qnorm(0.625, mean=m, sd=s) 
        , q50 = qnorm(0.50, mean=m, sd=s) 
        , q375 = qnorm(0.375, mean=m, sd=s) 
        , q125 = qnorm(0.125, mean=m, sd=s) 
      ) 
+0

ありがとう、それは私が探していたものです:) – Cirrus

関連する問題