2017-10-03 8 views
0

データ解析ラボでは、データセットから予測するための最良のモデルを作成する必要があります。二次条件と線形&二次関数の同時使用

私の理解から、対話項(二次項)を予測項として線形項と共に含む回帰モデルは、線形項のみを使用する対応するモデルよりも一般的です。

リニア用語を使用するのは、両方を使うよりも優れていますか?

私の印象は、個々の用語があまり関連していない場合、関連する用語を追加するとデータが乱雑になります。これは本当ですか?私はそのコンセプトを理解しているかどうか分からない。

+0

プログラミングではなく、データ分析/ ML質問です。 –

+0

@MarcusMüller申し訳ありませんが、私は自分のタグがそれを処理すると思いました。私は質問を投稿すべき他の場所がありますか? –

+0

stackexchangeネットワークにデータ分析/統計/ ml姉妹側があります... –

答えて

-1

これには多くの詳細がありますが、私は簡単な応答を続けます。いくつかの非常に単純なRコードを実証し、調整後Rを使用して、乗します:下の調整Rは、次の用語とモデルの乗

x <- c(3, 4, 5, 7, 10) 
y <- c(5, 8, 9, 11, 18) 
plot(x, y) 

yfit <- lm(y ~ x) 
rsquaredfit <- summary(yfit)$adj.r.squared 
rsquaredfit 

yfitquad <- lm(y ~ x + I(x^2)) 
yfitquad 
rsquaredfitquad <- summary(yfitquad)$adj.r.squared 
rsquaredfitquad 

注意を。ここで真の関係は明らかに線形であり、二次項は過大です。