私は、年齢間隔を作成するためにカット関数を使用しようとしています。残念ながら、最初のブレークの下端に一致する値のNAsを受け取ります。例えばカット関数は、間隔のためのNAを返します
:年齢は18と45の上にあるすべての値について
AGE <- sample(18:50, 100, replace = TRUE)
AGE_GROUPS <- cut(AGE, breaks = c(18, 27, 36, 45))
DF <- data.frame(AGE, AGE_GROUPS)
、IはAGE_GROUPS変数にNAを受け取ります。 AGE_GROUPSの一番下の括弧に18が含まれていることを確認するにはどうすればよいのですか?一番上の括弧に> 45の値がすべて含まれていることを確認するにはどうすればよいですか?
以下の回答に加えて、私は通常、レンジの面でより合理的なカットを得るために行うトリックを投稿したいと思います。私は '['または ']'が必要かどうかに応じて、変数の 'min'と' max'値で "再生"する傾向があります。例として、この 'AGE < - sample(18:50、100、replace = TRUE)を参照してください。 ユニーク(cut(AGE、breaks = c(min(AGE)-19、27、36、45、max(AGE)))); (AGE、ブレーク= c(最小(AGE)、19,27,36,45、最大(AGE)+1)、右= F)) '。あなたがチェックする必要があるのは、重複した休憩がないことだけです。 – AntoniosK