2017-06-02 9 views
-2

私は変数Xを以下の要約で示しています。分布を見ると、正規分布が歪んでいるように見えます。 Rの変数Xの各値にp値がどのように関連付けられているのでしょうか?あなたのプロットから判断歪んだ分布の確率を見つけよう

Min. 1st Qu. Median Mean 3rd Qu. Max. 
1.5 318.3 399.9 367.1 447.4 500.0 

enter image description here

+3

これはプログラミング上の統計量よりも多くの統計的な質問のように聞こえるので、https://stats.stackexchange.com/では良いでしょう。しかし、質問もかなり不明です、私はあなたが求めているp値が何を表しているのかを追うことができません。 – Marius

答えて

0

、私はあなたがdensity.default()を使用してカーネル密度推定量に合わせてみましたためaverageRankと呼ばれる数値のいくつかのシーケンスを、持っていると仮定します。

本質的に、確率密度関数の推定値(density.default()の出力)があります。あなたの質問には:

Rの変数Xの各値に関連するp値は、どのようにして見つけることができますか?

density.default()は、連続するものではなく、512の等距離点を除き、間接的にあなたに与えるものです。

:私はあなたが累積分布関数を探している感覚を得る、あなたの質問を提起した方法から、しかし

# Create some random data: 
set.seed(123) 
averageRank <- rnorm(100, mean = 300, sd = 75) 
x   <- 250 

kde  <- density.default(averageRank) 
closeness <- abs(kde$x - x) 
kde$y[which(closeness == min(closeness))] 
# [1] 0.004370022 # is P(X = 250) 

:あなたは、特定の値xため、density.default()と対応yが出力する最も近い値を見つけることができます

sum(kde$y[1:which(closeness == min(closeness))]/sum(kde$y) 
# [1] 0.2138626  # is P(X < 250) 
関連する問題