2016-11-07 15 views
2

私はcsvファイルに降雨値の時系列を持っています。私はデータのヒストグラムをプロットしました。ヒストグラムは左に歪んでいます。私は値が正規分布になるように変換したかったのです。 Rで利用できるYeo-Johnson変換を使用しました。変換された値はhereです。YeoとJohnsonの変換に関するラムダの推定

私の質問である:上記の変換において

、私は正常に動作ラムダ、0.5の試験値を用います。時系列からラムダの最適値を決定するために遠く離れていますか?私は何か提案を感謝します。

library(car) 
dat <- scan("Zamboanga.csv") 
hist(dat) 
trans <- yjPower(dat,0.5,jacobian.adjusted=TRUE) 
hist(trans) 

Here is the csv file

はこれまでのところ、ここのコードです。

答えて

2

まず、車のパッケージから関数boxCoxを使って最適なラムダを見つけ、λを最尤法で推定します。ベンBolkerコメントで言ったように、ここでのモデルはその後、最適化されたラムダを使用

your_model <- lm(dat~1) 

のようなものかもしれない

boxCox(your_model, family="yjPower", plotit = TRUE) 

example from CV

あなたはこのようにそれをプロットすることができますあなたの既存のコードで。

+1

私のデータには、どのモデル(Box-Coxコマンドのオブジェクト)が該当するのか混乱しています。現時点では、データにモデルを当てはめるわけではありません。 – Lyndz

+2

最も明白なことは、些細な線形モデル、 'your_model < - lm(dat_1)'に適合することです。 –

+0

@Lyndzはい、私はBen Bolkerのアドバイスを受け取ります。 –

関連する問題