私は集計データの3つの列を持つデータフレームを持っています:CreditScore、Count、Month。集計データから密度プロットを作成する
したがって、550,3,3の行は、行進に550クレジットスコアの3人がいることを意味します。
私は、2ヶ月間の信用度格差を比較するためにオーバーレイする密度プロットを作成しようとしています。
私はこれが本当にシンプルなはずだが、Googleで何も見つけることができないように感じる。任意の提案が高く評価されているR.
でこれをやろうとし
。
データ例:ggplot2
で
structure(list(CrScore = c(0L, 2L, 3L, 530L, 535L, 544L, 549L,
551L, 554L, 558L, 560L, 561L, 563L, 565L, 567L, 568L, 569L, 577L,
579L, 580L), Count.of.MFSAccount = c(2L, 9L, 2L, 1L, 1L, 1L,
1L, 1L, 1L, 2L, 1L, 1L, 3L, 1L, 1L, 2L, 1L, 2L, 1L, 1L), EnterDate.Month = structure(c(17136,
17136, 17136, 17136, 17136, 17136, 17136, 17136, 17136, 17136,
17136, 17136, 17136, 17136, 17136, 17136, 17136, 17136, 17136,
17136), class = "Date")), .Names = c("CrScore", "Count.of.MFSAccount",
"EnterDate.Month"), row.names = c(10L, 28L, 42L, 80L, 113L, 174L,
212L, 231L, 259L, 299L, 320L, 331L, 359L, 382L, 409L, 421L, 432L,
540L, 573L, 593L), class = "data.frame")
私はあなたが[再現可能な例を作る]場合は、いくつかの大きな助けを得ると思いますよ( http://stackoverflow.com/q/5963269/903061)、試したことの概要を説明します。 – Gregor
あなたはあなたのデータを解体します。つまり、各値を必要な回数複製しますか?巨大なデータセットを持っていない、または超効率が必要な場合は、おそらく最も簡単な方法です... –
データを分割することは私の最後の手段になるでしょう。集計されたデータでこれを行う方法がなければならないと思いましたか?アイデアはとてもシンプルに思えます。 –