marital
,gender
およびage
(たとえばMM32)の連結であるclass
変数を持っています。ビニング文字変数
Class ClassGrp
SM20 SM20-25
SM21 SM20-25
SM22 SM20-25
MF20 MF20-25
MF21 MF20-25
SF30 SF26-30
SF31 SF31-35
私はage
、gender
のための個別の列を持っている、とmarital
はので、私の最初のプロセスはとてもcut(data$Class, breaks = 10)
ようcut
機能によってage
を破ることだった。私は彼らが最終的な出力は次のようになるのグループにしたいと思います。しかし、私はそれらを20-25
形式に変換する方法について考えることはできません。
EDIT
入力データ
data <- structure(list(age = c(19L, 20L, 20L, 21L, 21L, 22L), gender = structure(c(2L,
1L, 2L, 1L, 2L, 1L), .Label = c("Female", "Male"), class = "factor"),
marital = structure(c(3L, 3L, 3L, 3L, 3L, 2L), .Label = c("Divorced",
"Married", "Single", "Widowed"), class = "factor"), class = c("SM19",
"SF20", "SM20", "SF21", "SM21", "MF22"), ageGrp = structure(c(1L,
1L, 1L, 1L, 1L, 1L), .Label = c("(18.9,25]", "(25,31]", "(31,37]",
"(37,43]", "(43,49]", "(49,55]", "(55,61]", "(61,67]", "(67,73]",
"(73,79.1]"), class = "factor")), .Names = c("age", "gender",
"marital", "class", "ageGrp"), row.names = c(NA, 6L), class = "data.frame")
を、あなたの入力の例を与えることができます。 – steveb
ClassGrpのGrp部分はどこから来たのですか?あなたの質問の上部にある例では、20-25,26-30などですが、入力データにはすべて同じ年齢GP(18.9 - 25)があります。 ageGrpはGrpの部分ですか? –
@ Hack-Rよく、私は20-25、26-30などでそれを持っていたいと思いますが、私が 'cut'関数を使用するとき、私はブレークの数を制御できるようです。それは私が望むものではないので、 'ageGrp'を無視することができます。 – Ken