独立したXの観測がない場合でも、従属変数Yの値がない場合にpredict.lm
コマンドを使用して線形回帰から予測値を生成する方法を理解できません。代数的にはこれは問題ではありませんが、Rでそれを行う効率的な方法はわかりません。たとえば、この偽のデータフレームと回帰モデルを考えてみましょう。ソースデータフレームで予測を割り当てようとしましたが、Y値が1つもないために予測できません。エラーが発生します。predict.lm Yのデータが欠落して回帰した後
# Create a fake dataframe
x <- c(1,2,3,4,5,6,7,8,9,10)
y <- c(100,200,300,400,NA,600,700,800,900,100)
df <- as.data.frame(cbind(x,y))
# Regress X and Y
model<-lm(y~x+1)
summary(model)
# Attempt to generate predictions in source dataframe but am unable to.
df$y_ip<-predict.lm(testy)
Error in `$<-.data.frame`(`*tmp*`, y_ip, value = c(221.............
replacement has 9 rows, data has 10
私は代数、df$y<-B0+ B1*df$x
を使用して予測を生成、またはモデルdf$y<-((summary(model)$coefficients[1, 1]) + (summary(model)$coefficients[2, 1]*(df$x))
の係数を呼び出すことにより、予測を生成することでこの問題を回避ました。しかし、私は現在、何百もの係数を持つ大きなデータモデルを扱っており、これらのメソッドはもはや実用的ではありません。私はpredict
機能を使用してそれを行う方法を知りたいです。
ありがとうございました!
予測の最初の引数; LMは、モデル自体ではなく、NEWDATAあります – agenis
ヘルプファイル '?predict.lm'を探してみると、関数を実行するのに必要な引数と例が表示されます。 – Biranjan
こんにちは@aronあなたの問題を解決する答えがあれば、それを他の人に見せてもらうように "accept"にしてください – agenis