2011-02-06 22 views
3

時系列データの確率分布を作りたいと思います。私のデータは次の形式になっていますRプロット密度平滑化時系列

00:00, 3 
01:00, 50 
05:00, 13 
10:00, 34 
17:00, 80 
21:00, 100 

時間列には、補間する必要があるいくつかの欠損値があります。私は、忙しい時代を強調するすばらしい滑らかな曲線を得たいです。私はtsと、densityplotで試しましたが、これらは私が何をしているのかわかりません。たとえば、

data1 <- read.csv(file="c:\\abc\\ts.csv", head=FALSE, sep=",") 
data1$V1 <- strptime(data1$V1, format="%H:%M") 
plot(data1$V2, density(data1$V1), type="l") 

しかし、これは狂った順序で、確率分布として描かれています。

答えて

2

私はあなたが間違いなくパッケージzooの後にいると思います。これには、NAを扱ういくつかの機能があります。 na.aggregate,na.approxおよびna.locfも参照のこと。

+0

NAは何を表しますか?ウェブ上で見つけるのが難しい、検索条件が悪い:r、zoo、na –

+0

@ Jason Axelson:NA =欠損値(利用不可) – daroczig

2

あなたは気づかないほど少し難しくしました。私はあなたの時代の前に日付を追加することで、今のところ簡単にします。

また、変数「texinp」とtextConnection()文を追加して、次のコードをカット/ペーストして直接実行できるようにしました。データは変数texinpにロードされ、.csvファイルの読み込みと同様の方法でread.zooステートメントによって読み込まれます。今のところ、これはプロットできるようになり、read.zooを使用して.csvファイルを読み込む方法のアイデアを提供します。

library(zoo) 
library(chron) 

texinp <- " 
Time, Mydata 
2011-02-06 00:00, 3 
2011-02-06 01:00, 50 
2011-02-06 05:00, 13 
2011-02-06 10:00, 34 
2011-02-06 17:00, 80 
2011-02-06 21:00, 100" 

myd.zoo <- read.zoo(textConnection(texinp), header=TRUE, FUN = as.chron, sep=",") 
myd.zoo 

plot(myd.zoo) 

ご質問から、「忙しい時期」についてお話ししました。私は間違っているかもしれませんが、私は21時00分の100の値が "最も忙しい期間"であると仮定しています。それが本当であれば、密度プロットは必要ありません。上のプロットは、あなたが後にしているプロットです。

私が間違っている場合は教えてください。

関連する問題