2017-10-15 22 views
0

第1、第3、第4分位点(つまり、0〜25%、25〜75%、75%〜75%)に基づいてRの列から数値データをビンしようとしています。 100%)。私は以下のコードを使用しましたが、ゼロはビニングに含まれません。それらはNAとして示されています。Rのカットと分位数が0を含まない

rawdata1$usage4 <- cut(rawdata1$Usage_Percentage, 
     breaks = quantile(rawdata1$Usage_Percentage, 
     probs = c(-Inf,0.25,0.75,Inf),include.lowest=T),labels=F) 

quantile.defaultでエラーが発生しました(rawdata1 $ Usage_Percentage、ちゃったごめんなさいを=のC(-Inf、 0.25、 'ちゃったごめんなさい' 外[0,1]

ただし、次を使用している場合コードと4分位数に分割し、ビンはちょうど良いです。

rawdata1$usage5 <- cut(rawdata1$Usage_Percentage, 
    breaks = quantile(rawdata1$Usage_Percentage), 
    include.lowest=T,labels=F) 
+2

probs = c(0,0.25,0.75,1)、 ' – G5W

答えて

0

あなたはまた、からcut2機能を使用することができますビニングにゼロを含めるには。 例を示します。

data <- data.frame(vect = c(1.64, 1.5, 1.5, 1.41, 1.64, 1.64, 0, 1.45, 1.64, 1.5, 1.45, 0, 1.45, 1.64, 
          1.5, 1.5, 1.5, 0, 1.5, 1.41, 0.18, 0.09, 0.1, 0.09, 0.05, 0.09, 1.64, 1.5, 
          1.5, 0.1, 0.05, 0.09, 0, 5.82, 5.86, 5.86, 0, 5.82, 5.82, 5.82, 5.82, 5.82, 
          5.86, 5.86, 5.82, 0, 5.91, 9.41, 9.5, 5.91, 0, 9.45, 5.91, 9.45, 5.91, 0, 
          0, 9.55, 5.91, 9.55, 9.5, 9.55, 0, 5.82, 1.64)) 

data$bin <- factor(Hmisc::cut2(data$vect, g = 4), labels = c(1:4)) 
#g represents the number of quantile groups 
関連する問題