2016-07-05 5 views
2

shiny appを作成していますが、ユーザーはいくつかの変数を含む.csvファイルをアップロードします。 dplyrを使用して、私はselect最初の4つの変数を以下に示すようにして、それらを長い形式から変換します。dplyrとtidyr:長い形式から広い形式に変換して列を並べ替える

DATA

df <- read.table(text = c(" 
Customer Rate Factor Power 
W1 6 TK1 5 
W2 3 TK1 0 
W3 1 TK1 0 
W4 2 TK1 0 
W5 4 TK1 0 
W6 8 TK1 0 
W7 5 TK1 0 
W8 7 TK1 3 
W1 6 TK2 0 
W2 3 TK2 1 
W3 1 TK2 0 
W4 2 TK2 5 
W5 4 TK2 0 
W6 8 TK2 0 
W7 5 TK2 0 
W8 7 TK2 3 
W1 6 TK3 0 
W2 3 TK3 5 
W3 1 TK3 1 
W4 2 TK3 0 
W5 4 TK3 0 
W6 8 TK3 0 
W7 5 TK3 0 
W8 7 TK3 0 
W1 6 TK4 0 
W2 3 TK4 3 
W3 1 TK4 0 
W4 2 TK4 0 
W5 4 TK4 0 
W6 8 TK4 0 
W7 5 TK4 0 
W8 7 TK4 0 
W1 6 TK5 1 
W2 3 TK5 0 
W3 1 TK5 5 
W4 2 TK5 0 
W5 4 TK5 1 
W6 8 TK5 0 
W7 5 TK5 0 
W8 7 TK5 0 
W1 6 TK6 0 
W2 3 TK6 0 
W3 1 TK6 0 
W4 2 TK6 0 
W5 4 TK6 0 
W6 8 TK6 0 
W7 5 TK6 5 
W8 7 TK6 0 
W1 6 TK7 0 
W2 3 TK7 0 
W3 1 TK7 0 
W4 2 TK7 0 
W5 4 TK7 0 
W6 8 TK7 3 
W7 5 TK7 3 
W8 7 TK7 0 
W1 6 TK8 0 
W2 3 TK8 0 
W3 1 TK8 1 
W4 2 TK8 0 
W5 4 TK8 0 
W6 8 TK8 3 
W7 5 TK8 0 
W8 7 TK8 0 
W1 6 TK9 0 
W2 3 TK9 0 
W3 1 TK9 0 
W4 2 TK9 0 
W5 4 TK9 5 
W6 8 TK9 0 
W7 5 TK9 0 
W8 7 TK9 0 
W1 6 TK10 0 
W2 3 TK10 0 
W3 1 TK10 0 
W4 2 TK10 0 
W5 4 TK10 0 
W6 8 TK10 5 
W7 5 TK10 0 
W8 7 TK10 0 
W1 6 TK11 0 
W2 3 TK11 0 
W3 1 TK11 0 
W4 2 TK11 0 
W5 4 TK11 0 
W6 8 TK11 0 
W7 5 TK11 0 
W8 7 TK11 3 
W1 6 TK12 0 
W2 3 TK12 0 
W3 1 TK12 0 
W4 2 TK12 0 
W5 4 TK12 0 
W6 8 TK12 0 
W7 5 TK12 0 
W8 7 TK12 5"), header = T) 
IがWIDE

library(dplyr) 
library(tidyr) 
df_wide <- df %>% 
    tidyr::spread(Factor, Power) 

RESULT

をTO

LONGワイドフォーマットに長いから変換するために以下のコードを使用

> df_wide Customer Rate TK1 TK10 TK11 TK12 TK2 TK3 TK4 TK5 TK6 TK7 TK8 TK9 1 W1 6 5 0 0 0 0 0 0 1 0 0 0 0 2 W2 3 0 0 0 0 1 5 3 0 0 0 0 0 3 W3 1 0 0 0 0 0 1 0 5 0 0 1 0 4 W4 2 0 0 0 0 5 0 0 0 0 0 0 0 5 W5 4 0 0 0 0 0 0 0 1 0 0 0 5 6 W6 8 0 5 0 0 0 0 0 0 0 3 3 0 7 W7 5 0 0 0 0 0 0 0 0 5 3 0 0 8 W8 7 3 0 3 5 3 0 0 0 0 0 0 0 

ワイドフォーマットはTK1としてFactor変数のレベルを示す、次いでTK10

> levels(df$Factor) 
[1] "TK1" "TK10" "TK11" "TK12" "TK2" "TK3" "TK4" "TK5" "TK6" "TK7" "TK8" "TK9" 

れるI因子のレベルがTK1からなりたい、TK12

までTK2 Iは以下のように解くことができます

df$Factor <- factor(df$Factor, levels = c("TK1", "TK2" , "TK3" , "TK4", "TK5" , "TK6" , "TK7" , "TK8" , "TK9", "TK10", "TK11", "TK12")) 

ただし、Factor変数のレベルは関数ですユーザーの入力のこれは、14、15または20

QUESTIONかもしれません

にかかわらず、ユーザーの入力の最高から最低から因子列の水準を配置する方法はありますか?

答えて

2

我々はlevelsfactorにそれを変更することができますが

df %>% 
    mutate(Factor = factor(Factor, levels = paste0("TK", 1:12))) %>% 
    spread(Factor, Power) 

それとももっと動的に指定、我々は別の列に非数値と数値の一部をextract(「因数1」、「因子2」) 'Factor1'の最初の文字値の値と 'Factor2'の値が~maxの値でで指定されたfactorに変更し、 'Factor1'と 'Factor2'、およびspreadを削除します。

library(tidyr) 
res <- df %>% 
     extract(Factor, into = c("Factor1", "Factor2"), "(\\D+)(\\d+)", 
            remove = FALSE, convert=TRUE) %>% 
     mutate(Factor = factor(Factor, levels = paste0(Factor1[1], 
           min(Factor2):max(Factor2)))) %>% 
     select(-Factor1, -Factor2) %>% 
     spread(Factor, Power) 
head(res, 2) 
# Customer Rate TK1 TK2 TK3 TK4 TK5 TK6 TK7 TK8 TK9 TK10 TK11 TK12 
#1  W1 6 5 0 0 0 1 0 0 0 0 0 0 0 
#2  W2 3 0 1 5 3 0 0 0 0 0 0 0 0 
+0

多くのご協力いただきありがとうございます。別のユーザーが12の代わりに17のレベルを持っている場合はどうすればいいですか?私はユーザーの入力のレベルの数に関係なく動作するコードが必要です – aelwan

+0

@aelwan投稿を更新しました – akrun

+0

ありがとうございますAkrun。このエラーが発生しました '[.data.frame'(。、Factor、into = c(" Factor1 "、" Factor2 ")、"(\\ D +)(\\ d +) "、: 未使用引数( "Factor1"、 "Factor2")、削除= FALSE、変換= TRUE) – aelwan

関連する問題