logistic-regression

    -1

    1答えて

    私は、ロジスティック回帰のバイナリクラスの問題で、各サンプルに対して330サンプルと27のフィーチャを持つデータセットを持っています。 "10の場合のルール"によれば、各機能を含めるには少なくとも10のイベントが必要です。私は不均衡なデータセットを持っていますが、陽性クラスは20%、陰性クラスは80%です。 これは私にわずか70イベントを与え、約7/8フィーチャをLogisticモデルに含めること

    -1

    1答えて

    私は統計情報とRで非常に新しいです。私のデータセットでは、目標変数は、飛行が遅れているのか、それともオンタイムであるのかを予測する飛行状況です。したがって、応答変数 - 遅延と時間 - には2つの値があります。したがって、を使用してロジスティック回帰モデルを構築するには、最初にターゲット変数を0と1に再コード化する必要がありますか?私はそれが0-Delayedである必要があり、Ontimeに対して

    1

    1答えて

    LogisticRegressionWithLBFGSをx回呼び出す繰り返しがあります。 問題は、繰り返しがループごとに遅くなり、最終的には永遠にハングすることです。 私はさまざまなアプローチを試みましたが、これまでのところ運がありません。 コードは以下のようになります。 def getBootsrapedAttribution(iNumberOfSamples, df): def p

    3

    1答えて

    次のコードを実行しようとしています。 Btw、私はPythonとSklearnの両方に新しいです。 File "C:\Anaconda3\lib\site-packages\sklearn\linear_model\logistic.py", line >1174, in fit check_classification_targets(y) File "C:\Anaconda3\lib\site

    1

    1答えて

    ロジスティック回帰の手動実装はExcelのhttp://blog.excelmasterseries.com/2014/06/logistic-regression-performed-in-excel.htmlにあります。 この実装は、以下のデータセットを使用し、報告し、次の係数 B0 = 12.48285608 B1 = -0.117031374 しかしB2 = -1.469140055 、と

    0

    2答えて

    ためにScalaでロジスティック回帰を実行するには val df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").load("D:/ModelData.csv") +---------+---------+---+-----+-------+ |c1 | c2 |c3 | c4 |

    1

    1答えて

    私は、目での事象の確率の断面ロジスティック回帰モデリングを行っています。各患者にはPatientIDが割り当てられ、各目にはEyeIDが割り当てられます。患者あたり2眼がある。 私はコードブローを添付しました。 PROC GENMOD data=new descend; class patientID Explan1(ref="0") Explan2(ref ="0") Gender(r

    0

    1答えて

    これは私が見たものとよく似ているようですが、いくつかの潜在的な原因があります。 私はPythonでロジスティック回帰をまとめようとしています。私のデータは、パンダのデータフレームとして保存されます。 train, test = train_test_split(final_dat[train_cols], train_size=0.80, random_state=1) logit = sm.L

    0

    1答えて

    ロジスティック回帰を実装する際に、私は段階的にどのように進めるべきかという面でいくつかの困難を抱えています。私がこれまで行ったことによると、私は次のようにそれを実装しています: まず機能の数に等しいthetaを取り、そのゼロのn*1ベクトル作ります。今すぐ勾配 grad = (1/m) * sum ((sigmoid(X*theta) - y')*X);を計算最後に J= 1/m *((sum(-

    0

    1答えて

    Rを使用してパネルデータのロジスティックユニット固定効果モデルを推定しようとしています。私の従属変数はバイナリであり、13か所で2年間毎日測定されます。 このモデルの目的は、xに基づいて特定の日と場所のyの値を予測することです。これを行うには、利用可能なパッケージを調査しながら zero <- seq(from=0, to=1, by=1) ids = dplyr::data_frame(loc