logistic-regression

    5

    1答えて

    私は非常に大きなデータセット(ds)を持っています。列の1つがPopularityで、タイプがfactor( '高'/'低')です。 トレーニングセット(ds_tr)とテストセット(ds_te)を作成するために、データを70%と30%に分割しました。私はロジスティック回帰を使用して、以下のモデルを作成した : mdl <- glm(formula = popularity ~ . -url , f

    5

    1答えて

    ステップ0:問題の説明私は分類の問題を抱えている は、すなわち私はロジスティック回帰を使用して、数値的な特徴の集合に基づいて、バイナリターゲットを予測したい、と実行した後主成分分析(PCA)。 フィジカルとターゲットを含むパンダのデータフレームとして、df_trainとdf_valid(それぞれトレーニングセットと検証セット)の2つのデータセットがあります。最初のステップとして、get_dummi

    7

    3答えて

    カテゴリデータをsklearn.linear_modelのLogisticRegressionの機能として使用する方法を理解しようとしています。 もちろん私はそれをエンコードする必要があります。私は理解していない何 は、それがカテゴリ機能として処理されますので、ロジスティック回帰へのエンコード機能を渡す方法で、標準定量化機能として符号化するとき、それが得たint値を解釈しません。 (あまり重要では

    17

    1答えて

    ロジスティック回帰係数を返す方法を知り、予測確率を自分で生成できるようにする必要があります。 sigmoid(dot([val1, val2, offset], lr.coef_.T)) しかし:私は、私はこのような予測確率を返すことができるように、典型的なロジスティック回帰をたどるlr.coeff_値を想定していた lr = LogisticRegression() lr.fit(trai

    9

    1答えて

    私は、ロジスティック回帰アルゴリズムによって訓練されたバイナリ予測モデルを持っています。私は、ポジティブまたはネガティブなクラスの決定にどの機能(予測子)が重要かを知りたい。私はcoef_パラメータがscikit-learnパッケージから来ることを知っていますが、それが重要であるかどうかは分かりません。もう一つは、負のクラスと正のクラスの重要性の観点から、coef_の値をどのように評価できるかです

    6

    2答えて

    私は現在、機械学習プロジェクトに取り組んでいます - データ行列Zとベクトルrhoを与えられました。 logistic loss functionはrhoです。計算には基本的な行列 - ベクトル乗算とlog/exp演算が含まれ、数字のオーバーフローを回避するためのトリックがあります(previous postで説明)。 私は現在、以下に示すようにNumPyを使用してPythonでこれを行っています