2017-07-11 21 views
-1

私はsklearnを使用してPythonで線形回帰を実装しています。PythonでAUC ROCを計算する際にエラーが発生しました

linear_model.LinearRregression()関数を使用してモデルを正常に訓練しました。

ここでは、AUC ROCメソッドを使用してモデルの良否を測定したいと考えています。以下のように1行目では、取得中にエラーが

train_set[predictors1], train_set["loan_status"] = make_classification(n_samples=4000, n_features=2, n_redundant=0, flip_y=0.4) 
train, test, train_t, test_t = train_test_split(train_set[predictors1], train_set["loan_status"], train_size=0.9) 

rf.fit(train, train_t) 

を:しかし 私は同じことを行うため、次のコードを使用していmake_classificationため

ValueError: Must have equal len keys and value when setting with an ndarray

+0

_X, df['loan_status'] = make_classification() df['my_col'] = _X[0] # or df['my_col'] = _X[1] 
[make_classification(http://scikit-learn.org/stable/modules/generated/sklearn.datasets.make_classification.html)返す 'のX:形状のアレイ[n_samples、n_features]' 'とY :形状の配列[n_samples] 'です。つまり、ndarray' train_set [predictors1] 'に違う形のものを設定しようとしています。 「X、y = make_classification(n_samples = 4000、n_features = 2、n_redundant = 0、flip_y = 0.4)」のようにしてください。 http://scikit-learn.org/stable/auto_examples/calibration/plot_calibration_curve.html#sphx-glr-auto-examples-calibration-plot-calibration-curve-py – mkaran

答えて

1

Documentation

Returns:
X : array of shape [n_samples, n_features] The generated samples.

y : array of shape [n_samples] The integer labels for class membership of each sample.

がどのように見えると言います問題はXが2つの配列を持つリストであり、それらの配列をあなたのpandas datの1つの列に割り当てようとしていることですフレーム。どのアレイを分離して、それを目的の列に割り当てる必要があります。

関連する問題