2017-02-21 7 views
1

私は2つのデータフレームに1つの共通の列がある場合があります。データフレームの1つに余分の行があります。データフレームの1つに余分の行が含まれている2つのdata.framesをマージします。

> df1 
       type  x   y 
1     A  10   417 
2     B  2   575 
3     C  3   14 
4     D  944   205 
5     E  44   87 
6     F  355   883 
7     G  73   150 

> df2  
    X1 X2 X3 X4 X5 X6 term 
1 9 28 3 34 5 39 B 
2 43 7 39 41 46 32 C 
3 17 30 0 27 0 9 D 
4 42 32 1 10 26 49 E 
5 21 17 34 28 35 12 F 
6 16 10 18 25 2 0 G 

私は列の残りのNAを導入しながら、term Aを含む行を挿入しながら、DF2するDF1から列X、Yを追加したいです。

目的は以下を得ることである:

X1 X2 X3 X4 X5 X6 x y term 
    NA NA NA NA NA NA 10 417 A 
    9 28 3 34 5 39 2 575 B 
    43 7 39 41 46 32 3 14 C 
    17 30 0 27 0 9 944 205 D 
    42 32 1 10 26 49 44 87 E 
    21 17 34 28 35 12 355 883 F 
    16 10 18 25 2 0 73 150 G 

私はtermとして共通の列を使用してマージ機能を試みたが、うまくいきませんでしたし、私は解決策

cbindPad <- function(...){ 
    args <- list(...) 
    n <- sapply(args,nrow) 
    mx <- max(n) 
    pad <- function(x, mx){ 
    if (nrow(x) < mx){ 
     nms <- colnames(x) 
     padTemp <- matrix(NA, mx - nrow(x), ncol(x)) 
     colnames(padTemp) <- nms 
     if (ncol(x)==0) { 
     return(padTemp) 
     } else { 
     return(rbind(x,padTemp)) 
     } 
    } 
    else{ 
     return(x) 
    } 
    } 
    rs <- lapply(args,pad,mx) 
    return(do.call(cbind,rs)) 
} 

を見つけました。しかし、これはしませんでしたいずれかの作業。

答えて

1

mergeを使用してください。一般的な列の名前は、typeの場合はdf1termの場合はdf2なので、の機能にはby.xby.yの引数で渡す必要があります。また、all=TRUEと設定します。

> merge(df1, df2, by.x="type", by.y="term", all=TRUE) 
    type x y X1 X2 X3 X4 X5 X6 
1 A 10 417 NA NA NA NA NA NA 
2 B 2 575 9 28 3 34 5 39 
3 C 3 14 43 7 39 41 46 32 
4 D 944 205 17 30 0 27 0 9 
5 E 44 87 42 32 1 10 26 49 
6 F 355 883 21 17 34 28 35 12 
7 G 73 150 16 10 18 25 2 0 
+0

申し訳ありません実際には同じ名前を使用するように名前を変更しています。私は 'by.x =" type "、by.y =" type "'を使うことができます。答えとして受け入れるのを待たなければならない:) –

+1

@ Null-仮説、共通の列に同じ名前があるときは、 'by = type'を使って' by.x = type'と 'by.y = type'を取り除くことができます。 '?merge'を参照してください。 –

関連する問題