2017-07-31 18 views
2

回帰分析を行い、データセットdiamonds.csvの最適モデルをggplot2に見つけようとします。私は価格(応答変数)vsカラットを使用し、私は線形回帰、二次および三次回帰を実行します。このラインは最適ではありません。私は最高のフィッティング・ラインを持つエクセルからの対数を理解します。しかし、対数フィッティング線を見つけるためにRでコーディングする方法を理解できませんでした。誰でも助けることができますか?モデル2カラット対 ログラジアのR - 回帰分析

model<-lm(price~carat, data = diamonds) 

価格を比較

はどのように取得するにはRでログをコーディングすることができますMODEL3

model3 <- lm(price~carat + I(carat^2) + I(carat^3), data = diamonds) 

に立方

model2<-lm(price~carat + I(carat^2), data = diamonds) 

使用を比較するために、多項式を使用していますExcelと同じ結果ですか?

Y = 0.4299ln(X) - 2.5495 R²= 0.8468

ありがとう!

答えて

0

excel y = 0.4299ln(x) - 2.5495から報告した結果には、多項式または3次項は含まれていません。あなたは何をしようとしているのですか? priceは非常に歪曲されており、「収入」と同様にログを取るのが一般的です。これはまたあなたが参照しているR2を提供しますが、インターセプトパラメータとカラットパラメータの係数は非常に異なります。

m1 <- lm(log(price) ~ carat, data = diamonds) 
summary(m1) 
Call: 
lm(formula = log(price) ~ carat, data = diamonds) 

Residuals: 
    Min  1Q Median  3Q  Max 
-6.2844 -0.2449 0.0335 0.2578 1.5642 

Coefficients: 
      Estimate Std. Error t value Pr(>|t|)  
(Intercept) 6.215021 0.003348 1856 <2e-16 *** 
carat  1.969757 0.003608  546 <2e-16 *** 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 0.3972 on 53938 degrees of freedom 
Multiple R-squared: 0.8468, Adjusted R-squared: 0.8468 
F-statistic: 2.981e+05 on 1 and 53938 DF, p-value: < 2.2e-16 
+0

お世話になりました!私はあなたの助けによってこれを理解します。 logmodel < - lm(price〜log(carat)、data = diamonds) 概要(logmodel) –

+0

素晴らしい!どうしてあなたがカラットのログを望んでいるのか分かりませんが、あなたのニーズに合ったものを選んでください!あなたがそれを好きなら答えをアップアップ/受け入れてください! – Richard

+0

これは新しいです。私はあなたの答えをアップアップして好きですか? –