私はRの新人です。私はかなりの時間からこの問題に直面してきました。 「dplyr」パッケージを使用してデシルまたは四分位を作成しようとするたびに、デシルがより少ないグループにマージされます。 Like 私は6、4、時には3になるのに対し、私は10の異なるグループが欲しいです。 小さいデシルをグループ化/マージしようとします。 しかし、私はこの問題を避けたいです。助けてください! ありがとうございます!RのDecilesの自動マージを避けるには?
コードは次のとおりです。ここで
mydata <- data.frame(col1= c(0,00,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,5,3,12,5,65,23,65984,21,5469,321,6,100,200,300,400,500,600,700,800,900,1000,1100,1200,1300,1400,1500,5233,18000))
DecLocations <- quantile(mydata$col1, probs = c(0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9))
mydata$decile <- findInterval(mydata$col1,c(-Inf,DecLocations, Inf))
require(dplyr)
mydata$decile<-factor(mydata$decile)
decile_grp<-group_by(mydata,decile)
decile_summ_test<-summarize(decile_grp, total_cnt=sum(col1))
decile_summ_test<-arrange(decile_summ_test, desc(decile))
View(decile_summ_test)
Rが小さい十分位数をマージするので、私は唯一の最初の6個の十分位数を取得しています。これは私がここで避けようとしているものです。私は実際に小さな数字を持っていても、すべて10デシールを得ることを期待しています。
最小限の再現可能な例? – CPak
問題を説明し、出力として期待する簡単なデータ例を提供する必要があります。コメントにコードを追加しないでください。むしろ、オリジナルの投稿をあなたのコード/例/更新で編集してください。 – CPak
@CPakはこれを今行った! – PerryThePlatipus