集計データから密度プロットを作成する

私は集計データの3つの列を持つデータフレームを持っています：CreditScore、Count、Month。集計データから密度プロットを作成する

したがって、550,3,3の行は、行進に550クレジットスコアの3人がいることを意味します。

私は、2ヶ月間の信用度格差を比較するためにオーバーレイする密度プロットを作成しようとしています。

私はこれが本当にシンプルなはずだが、Googleで何も見つけることができないように感じる。任意の提案が高く評価されているR.

でこれをやろうとし

。

データ例：ggplot2で

structure(list(CrScore = c(0L, 2L, 3L, 530L, 535L, 544L, 549L, 
551L, 554L, 558L, 560L, 561L, 563L, 565L, 567L, 568L, 569L, 577L, 
579L, 580L), Count.of.MFSAccount = c(2L, 9L, 2L, 1L, 1L, 1L, 
1L, 1L, 1L, 2L, 1L, 1L, 3L, 1L, 1L, 2L, 1L, 2L, 1L, 1L), EnterDate.Month = structure(c(17136, 
17136, 17136, 17136, 17136, 17136, 17136, 17136, 17136, 17136, 
17136, 17136, 17136, 17136, 17136, 17136, 17136, 17136, 17136, 
17136), class = "Date")), .Names = c("CrScore", "Count.of.MFSAccount", 
"EnterDate.Month"), row.names = c(10L, 28L, 42L, 80L, 113L, 174L, 
212L, 231L, 259L, 299L, 320L, 331L, 359L, 382L, 409L, 421L, 432L, 
540L, 573L, 593L), class = "data.frame")

出典

2017-01-10 Justin Leonard

私はあなたが[再現可能な例を作る]場合は、いくつかの大きな助けを得ると思いますよ（ http://stackoverflow.com/q/5963269/903061）、試したことの概要を説明します。 – Gregor

あなたはあなたのデータを解体します。つまり、各値を必要な回数複製しますか？巨大なデータセットを持っていない、または超効率が必要な場合は、おそらく最も簡単な方法です... –

データを分割することは私の最後の手段になるでしょう。集計されたデータでこれを行う方法がなければならないと思いましたか？アイデアはとてもシンプルに思えます。 –

重みとしてCount.of.MFSAccountの正規化されたバージョンを使用して：

library(ggplot2) 
library(dplyr) 

# Create weights that are normalized within each date 
df <- df %>% 
     group_by(EnterDate.Month) %>% 
     mutate(w = Count.of.MFSAccount/sum(Count.of.MFSAccount)) 

# Plot with constructed weights 
ggplot(df, aes(CrScore, weight=w, color=factor(EnterDate.Month))) + geom_density()

出典

2017-01-10 22:59:47 Thales

これはまさに私が欲しかったことです、ありがとう！ –

集計データから密度プロットを作成する

答えて

関連する問題