私は、「世帯数」、「世帯主」、「教育」、「収入」の変数を持つカップルのデータを持っています。 「世帯数」は、各世帯に一意的に割り当てられるID番号です。 (1 =世帯主、2 =世帯主の配偶者)、「教育」と「所得」はそれぞれの教育水準と所得である。たとえば、データは以下のようになります。配偶者変数を作成するには?
'household_number' 'head_of_household' 'education' 'income'
1 1 high 1000
1 2 low 100
3 1 medium 500
3 2 high 800
4 2 high 800
4 1 high 800
9 1 low 150
9 2 low 200
個人ごとに配偶者の変数を作成したいと考えています。そのデータは以下のようになります。 「配偶者エデュー」は配偶者の教育水準で、「配偶者」は配偶者の所得です。
'household_number' 'head_of_household' 'education' 'income' 'spouse_edu' 'spouse_inc'
1 1 high 1000 low 100
1 2 low 100 high 1000
3 1 medium 500 high 800
3 2 high 800 medium 500
4 2 high 800 high 800
4 1 high 800 high 800
9 1 low 150 low 200
9 2 low 200 low 150
私は非常に大きなデータセットを持っていますので、私はこれを行う簡単な方法を探しています。これを行うためのエレガントな方法はありますか?
以下は再現可能な構文の例です。
household_number <- c(1,1,3,3,4,4,9,9)
head_of_household <- c(1,2,1,2,2,1,1,2)
education <- c("high", "low", "medium", "high", "high", "high", "low", "low")
income <- c(1000, 100, 500, 800, 800, 800, 150, 200)
data <- data.frame(household_number, head_of_household, education, income)
'data.table'がお手伝いします。 – MKR