Pythonで以下のRコードに表示される統計を取得する方法を検索します。Pythonで標準化された残差、クックの値、ハザード値(レバレッジ)などに簡単にアクセスできますか?
私はSKlearnとStatsmodelsを試しました。 Statsmodelsは線形回帰モデルをフィッティングした直後に多くの統計を提供します。私は料理人のDがインプリメントされる影響力プロットのようなものもあることを知っています。
しかし、すべての計算を自分で行う必要はなく、データを自分で処理したいと考えています。
モデルをRに収めたとすると、これらの値は単純な関数で得ることができます。
hatvalues(fitted_model) #hatvalues (leverage)
cooks.distance(fitted_model) #Cook's D values
rstandard(fitted_model) #standardized residuals
rstudent(fitted_model) #studentized residuals
など
statmodelsでは、多くの統計は、私が探していますものの結果に保存されているが、残念ながらされていません。あなたは私が簡単にこれらの統計を取得する方法を知っている場合、私は感謝される
#import statsmodels
import statsmodels.api as sm
#Fit linear model to any dataset
model = sm.OLS(Y,X)
results = model.fit()
#Creating a dataframe that includes the studentized residuals
sm.regression.linear_model.OLSResults.outlier_test(results)
:私は見つけることができる唯一のことは、スチューデント化残差でした。それらを手動で計算する方法ではありません。要点は、Rで簡単にアクセスできることです。Pythonでも比較的簡単な方法があるはずです。私はここでそれを見つけた
results.resid_pearson