0
ロジスティックモデルを訓練し、相互検証し、joblibモジュールを使用してファイルに保存しました。今私はこのモデルを読み込み、それを使って新しいデータを予測したいと思います。 これは正しい方法ですか?特に標準化。私も新しいデータにscaler.fit()を使うべきですか?私が従ったチュートリアルでは、scaler.fitはトレーニングセットでのみ使用されていたので、ここで少し失われています。ここで新しいデータをロードして予測するsklearn
は私のコードです:
#Loading the saved model with joblib
model = joblib.load('model.pkl')
# New data to predict
pr = pd.read_csv('set_to_predict.csv')
pred_cols = list(pr.columns.values)[:-1]
# Standardize new data
scaler = StandardScaler()
X_pred = scaler.fit(pr[pred_cols]).transform(pr[pred_cols])
pred = pd.Series(model.predict(X_pred))
print pred
ありがとう、David! –