2017-09-15 8 views
-1

私のデータフレームには、各列/変数に多くの異常値がありました。 75%/ 25%のBoxplot/IQRカットオフを使用してそれらを除去しました。私は各列を取り出し、それらから異常値を取り除いた。したがって、各列の値の数が異なります。今、私はそれらの外れ値を持たないすべてのNEW変数を単一のデータフレームに結合したいと思います。データフレームにこのエラーが表示されます。この問題をどうやって解決するのですか?なぜなら、その新しいデータフレームでロジスティック回帰を実行しなければならないからです。私はcbind.data.frameを試みた後、rbindと似ていますが、それは問題を解決していません。ここでDataframeのエラー:引数の数が異なることを暗示しています

はコードです:

newdata <- data.frame(finalsbp, mynewT, mynewldl,mynewtypea1, mynewobesity, mynewalcohol, age, famhist) 

Error in data.frame(finalsbp, mynewT, mynewldl, mynewtypea1, mynewobesity, : 

arguments imply differing number of rows: 447, 443, 448, 458, 454, 429, 462 

P.S.年齢と養育者の長さは同じです。つまり、462

+1

私はあなたのデータにmerge()を使用しています。最小限の再現可能な例を作るためのコードと、期待される出力が何であるかを記述してください。 'で' と一致する必要があります。 が、私はこれが >マージ(finalsbp、mynewT、mynewldl、mynewtypea1、mynewobesity、mynewalcohol、年齢、famhist)fix.byで エラー(by.x、x)を試してみました@RichardLusch –

+1

列の番号 –

+0

@リチャードLuschL私は私の質問を編集した、あなたがチェックすることができます。私の質問に助けが必要です。あなたが答えることができないなら、うまくいっても-1を与えてはいけません(特に私が変更を加えたとき)。 –

答えて

0

データの詳細がわからない場合は、this postに示されているように、各ベクトルの長さを同じようにすることができます。

a <- seq(from = 1, to = 10) 
b <- seq(15, 30) 
c <- seq(2, 10) 

length(a) <- n 
length(b) <- n 
length(c) <- n 

newdata <- cbind(a, b, c) 

これは、データフレームの最後にすべてのブランクがNAとして表示されることを前提にして、問題を解決するはずです。

+0

ありがとうございます。できます。私はn = 500を追加したので、長さはデータフレームを作るために一様になります。 –

関連する問題