DSL回線のインターネットセッションに関するデータを分析する必要があります。私は、セッションの持続時間がどのように分散されているかを見たいと思っていました。これを行う簡単な方法は、すべてのセッションの期間の確率密度プロットを作成することから始まると考えました。データの確率密度を得る
データをRにロードし、density()
関数を使用しました。だから、このようなものでした。
plot(density(data$duration), type = "l", col = "blue", main = "Density Plot of Duration",
xlab = "duration(h)", ylab = "probability density")
私はこの種の分析に慣れています。これはgoogleを通って私が見つけたものでした。私はプロットを得たが、私はいくつかの質問を残した。これは私がやろうとしていることをするための正しい機能ですか、それとも何か他のものがありますか?
プロットでは、Y軸のスケールが0〜1.5であることがわかりました。私はそれが1.5であることができる方法を得ていない、それは0 ... 1からではないでしょうか?
また、私はより滑らかな曲線を得たいと思います。データセットが本当に大きいので、線は実際にギザギザです。私がこれを提示しているときにそれらを滑らかにすることは、より良いでしょう。それをどうやってやりますか?
濃度が誤っています。 Xの密度は**集団からXのすぐ近くにある数を描画する機会に比例した値**として見ることができます。ここで密度関数の積分は1になります。これは、密度関数の最大値が1であることを意味するものではなく、容易に大きくすることができる。実際、df =(1,1)を有するF分布の場合、密度(0における)の最大値は偶数である。 –
@ヨリスはい私はそれを正しく解釈していないことを今や分かっています。むしろ単純に私は確率分布から1未満であると仮定していました。 – sfactor