2016-10-25 13 views
0

だから、私は、列 - > ProsperRating..numericのデータフレーム - > y上にヒストグラムをプロットしようとしています。 (変数名の最後にピリオドがあります)。R離散変数上のヒストグラム - ビンの2つがスティック

これは私が今までに得たものです。 (ノーマルカーブをオーバーレイした後)。

h <- hist(y$ProsperRating..numeric.,breaks = c(0,1,2,3,4,5,6,7)) 
xfit <- seq(min(y$ProsperRating..numeric.) , max(y$ProsperRating..numeric.) , length = nrow(y)) 
yfit <- dnorm(xfit, mean = mean(y$ProsperRating..numeric.), sd = sd(y$ProsperRating..numeric.)) 
yfit <- yfit * length(y$ProsperRating..numeric.) *diff(h$mids[1:2]) * 1.8 
lines(xfit,yfit,lwd = 2) 

Histogram plot - Notice 1 and 2 numbered bins sticking together

私もこれを行うことができます他の方法はありますか?総ノブからRへ

編集1:Prosper rating数値は私のデータフレーム内の列です。 1〜7の値が1のインクリメントで含まれます(x = seq(1,7,1))。それが私がここにプロットしようとしているものです。

編集2:新しいノーマルカーブを追加する。ブレークを反映するようにコードを変更しました。 New Normal Curve! これが正しく行われたかどうかは分かりません。

+0

あなたの問題は何ですか? – Jimbou

+0

イメージのように最初の2つのビンを貼る必要はありません。それ以外は、それは良い(私は推測する) –

+0

いくつかの再現可能なデータを追加します。 'dput(your_data)'を使用しています – Jimbou

答えて

0

休憩は単なる提案です。

明示的にビンサイズを制御する唯一の方法は、グラフを修正することを前提としています。 X軸のブレーク位置のベクトルにブレークを設定することです。

set.seed(1337) 
hist(rnorm(20), breaks = c(-3,-2,-1,0,1,2,3)) 

これは、ビンが「一緒にくっついている」と言われているのは、それが正確にどのように見えるのかということです。 1.5と2の間には1000個近くの観測値があります。それらの間にデータが存在しない場所にビンを追加するか、データを見ることなくビンを0から1に追加することでビジュアルの問題を修正できるかもしれません。breaks = c(0,1,2,3,4,5,6,7)

私はこれを行うことをお勧めします。

x <- c(rep(1,8000),rep(2,10000),rep(3,15000), rep(4, 20000), rep(5, 15500), rep(6, 14500), rep(7, 5000)) 
hist(x, breaks = c(0,1,2,3,4,5,6,7)) 

とにかく見るのがはるかに良いと思うすべてのスペースを取り除きます。

+0

Hey @Matt L.それは素晴らしい仕事でした。どうもありがとうございました。正常な曲線が正しいかどうか教えていただけますか?私はそれが与えられたプロットに対して正しくないと感じている。ありがとう! –

+0

@WhatIfTheyGetMe正しく見えます。法線の代わりにt分布をフィットさせたいかもしれません。 tは太い尾を持っています。私はそれがあなたのデータによく合うと思います。新しいグラフの限界を修正するには、hist関数の中で 'ylim = c(0,20000)'を実行することができます。 –

+0

まさに私が望むもの。あなたがすでにあなたに語っていないなら、マット・L.ありがとう! –

関連する問題