statsmodels

0熱

1答えて

私はPythonでStatsModelsを使って累積確率プロットを作成しましたが、軸上にティックが多すぎます。 0.1,10,50,90,99、および99.9の目盛りが必要です。誰でもこの仕事をする方法を知っていますか？私は以下のコードを使用してみましたが、それは私だけダニの最初のn数を与え、それはかなり無駄にすること（下図を参照してください。） import numpy as np impor

2熱

1答えて

パンダと統計モデルで未来を予測する

私がしなければならないことは、これらの「必要条件」を使って将来の温度をプロットすることです：「最近のデータポイントから一次関数の係数を推定する（を使用して、過去2回は正常です。より徹底したい場合は、過去10回程度を使用しています）。さらに、CO2排出量の増加率は今日と同じすなわち、2015年にXトンのCO2排出量が2015年にはよりも多い場合、2017年に2016年に比べてXトンのCO2排出

0熱

1答えて

統計モデルのマルチプロセッシングを減らすglm

ロジスティック回帰を必要とするビジネスプロセスの概念実証を現在行っています。私はデータセット（以下のコードに従って）に対して分類を実行するために統計モデルglmを使用しています。私たちのデータセットは、約10M行と約80個のフィーチャ（ほぼ70+がダミー、例えば定義されたカテゴリ変数に基づいて "1"または "0"）で構成されています。小さなデータセットを使うと、glmはうまく動作しますが、完全な

-1熱

1答えて

統計モデルとscikit-learnが異なるモデルパフォーマンス評価

データセットに多変数線形回帰を適合させて、モデルがデータをどれだけうまく説明しているかを調べようとしています。私の予測因子は120件の寸法を持っていると私は177個のサンプルがありますstatsmodelsを使用して X.shape =（177120）、y.shape =（177）を、私は非常に良いR二乗0.76のを取得しますProb（F-統計）は0.06であり、これは有意性に向かい、データの良

1熱

2答えて

線形回帰のy切片値を修正するにはどうすればよいですか？

私はこのようなものでscipyのダウンロードのlinregress()を使って自分のデータ間で最小二乗ラインにフィットするようにしようとしている： from scipy import stats import numpy as np y = [30, 60, 19, 28, 41, 49, 62, 75, 81] x = np.arange(0,9) grad, intercept,

0熱

1答えて

データフレームに列内の完全な一意の値を持つ単方向ANOVAが失敗する

statsmodelを使用してANOVAを実行すると、送信したデータフレームに次のような完全に異なる値を持つ列がある場合、地域列には西、東、南があります。ので、我々はANOVAを実行したとき - 片道 mod = smf.ols('y~x', data=dfx).fit() aov_table = sma.stats.anova_lm(mod, typ=1) 私は、次の表が印刷されたエラー

0熱

1答えて

python statsmodelsを使用したQuantile-Quantileプロットapi

特定のパラメータを持つ正規分布がデータセットに適合するかどうかを確認しようとしています。しかし、qqplotは期待通りに動作しないようです。誰もが説明でき：1私はポイントがスロープ= 1でラインの周りにあることを期待していたが、それは次の図を与える見ることができるように import numpy as np import statsmodels.api as sm import pylab

0熱

1答えて

StatsmodelsパッケージのUnobserved Componentsでどのように係数が推定されますか？

私は2年半以上の毎日の売上データを含む時系列に取り組んでいます。このプロジェクトの目的は、季節性と傾向を考慮しながら、マーケティング支出が売上に与える影響を見積もることです。私はUnobserved Componentsをstatsmodelパッケージから使用する予定でした。私の質問は、季節性、傾向およびサイクル成分とともに外生的要因の係数が推定されるか、または季節性、傾向およびサイクルを差し引