1
分離が必要な文字列値の列を持つデータフレームで作業することがよくあります。これは、データ入力プログラムの「複数選択」オプションから発生します(残念ながら変更できません)。私はtidyr::separate
を試しましたが、結果が正しく表示されません。例:新しい列の値が元のデータに依存するデータフレーム列の分割
require(tidyr)
df = data.frame(
x = 1:3,
sick = c(NA, "malaria", "diarrhoea malaria"))
df <- df %>%
separate(sick, c("diarrhoea", "cough", "malaria"),
sep = " ", fill = "right", remove = FALSE)
は、しかし、私は結果は次のようになりたい:
df2 = data.frame(
x = 1:3,
sick = c(NA, "malaria", "diarrhoea malaria"),
diarrhoea = c(NA, NA, "diarrhoea"),
cough = c(NA, NA, NA),
malaria = c(NA, "malaria", "malaria"))
右方向に任意の助けをいただければ幸いです。
おかげから
dcast
とsplitstackshape
からcSplit
を使用しているが、私は期待していたと同じように動作する、@akrun 。 –