statsmodels

    0

    1答えて

    私はPythonでStatsModelsを使って累積確率プロットを作成しましたが、軸上にティックが多すぎます。 0.1,10,50,90,99、および99.9の目盛りが必要です。誰でもこの仕事をする方法を知っていますか?私は以下のコードを使用してみましたが、それは私だけダニの最初のn数を与え、それはかなり無駄にすること(下図を参照してください。) import numpy as np impor

    2

    1答えて

    私がしなければならないことは、これらの「必要条件」を使って将来の温度をプロットすることです:「最近のデータポイントから一次関数の係数を推定する(を使用して、過去2回は正常です。より徹底したい場合は、過去10回程度を使用しています)。 さらに、CO2排出量の増加率は今日と同じ すなわち、2015年にXトンのCO2排出量が2015年には よりも多い場合、2017年に2016年に比べてXトンのCO2排出

    0

    1答えて

    ロジスティック回帰を必要とするビジネスプロセスの概念実証を現在行っています。私はデータセット(以下のコードに従って)に対して分類を実行するために統計モデルglmを使用しています。私たちのデータセットは、約10M行と約80個のフィーチャ(ほぼ70+がダミー、例えば定義されたカテゴリ変数に基づいて "1"または "0")で構成されています。小さなデータセットを使うと、glmはうまく動作しますが、完全な

    -1

    1答えて

    データセットに多変数線形回帰を適合させて、モデルがデータをどれだけうまく説明しているかを調べようとしています。私の予測因子は120件の寸法を持っていると私は177個のサンプルがありますstatsmodelsを使用して X.shape =(177120)、y.shape =(177) を、私は非常に良いR二乗0.76のを取得しますProb(F-統計)は0.06であり、これは有意性に向かい、データの良

    1

    2答えて

    私はこのようなものでscipyのダウンロードのlinregress()を使って自分のデータ間で最小二乗ラインにフィットするようにしようとしている: from scipy import stats import numpy as np y = [30, 60, 19, 28, 41, 49, 62, 75, 81] x = np.arange(0,9) grad, intercept,

    0

    1答えて

    statsmodelを使用してANOVAを実行すると、送信したデータフレームに次のような完全に異なる値を持つ列がある場合、地域列には西、東、南があります。 ので、我々はANOVAを実行したとき - 片道 mod = smf.ols('y~x', data=dfx).fit() aov_table = sma.stats.anova_lm(mod, typ=1) 私は、次の表が印刷されたエラー

    0

    1答えて

    特定のパラメータを持つ正規分布がデータセットに適合するかどうかを確認しようとしています。しかし、qqplotは期待通りに動作しないようです。誰もが説明でき :1私はポイントがスロープ= 1でラインの周りにあることを期待していたが、それは次の図を与える見ることができるように import numpy as np import statsmodels.api as sm import pylab

    0

    1答えて

    私は2年半以上の毎日の売上データを含む時系列に取り組んでいます。このプロジェクトの目的は、季節性と傾向を考慮しながら、マーケティング支出が売上に与える影響を見積もることです。 私はUnobserved Componentsをstatsmodelパッケージから使用する予定でした。私の質問は、季節性、傾向およびサイクル成分とともに外生的要因の係数が推定されるか、または季節性、傾向およびサイクルを差し引