1
Skrixのバージョン0.18.1でTimeSeriesSplitのクロスバリデーション戦略をLogisticRegressionエスティメータで使用しようとしています。私はそれを示すエラーを取得:Sklearn TimeSeriesSplit cross_val_predictはパーティションにのみ有効
from sklearn import linear_model, neighbors
from sklearn.model_selection import train_test_split, cross_val_predict, TimeSeriesSplit, KFold, cross_val_score
import pandas as pd
import numpy as np
from datetime import date, datetime
df = pd.DataFrame(data=np.random.randint(0,10,(100,5)), index=pd.date_range(start=date.today(), periods=100), columns='x1 x2 x3 x4 y'.split())
X, y = df['x1 x2 x3 x4'.split()], df['y']
score = cross_val_score(linear_model.LogisticRegression(fit_intercept=True), X, y, cv=TimeSeriesSplit(n_splits=2))
y_hat = cross_val_predict(linear_model.LogisticRegression(fit_intercept=True), X, y, cv=TimeSeriesSplit(n_splits=2), method='predict_proba')
私が間違って何をやっている:
cross_val_predictだけで再現する方法を示していたパーティション
次のコードスニペットのために働きますか?
ここでは、 'range(14)'に '14 'とは何ですか?それは任意の数字ですか?データフレーム値と同じです。あなたがこれらの価値観にどのようになったのか、私にはそれほど明確ではありません。 – keithhackbarth
14は恣意的で - 例として - 例です。データフレームについて:質問を見て、私はそれをコピーしました。 – glao