3
私のデータフレーム列の1つは日付です。 、私はさらにそれを使用する場合、しかしsklearn.cross_validation.cross_val_scoreでのpython pandasタイムスタンプの使用
print df['my_dates'].dtype
datetime64[ns]
sklearn.cross_validation.cross_val_score()
はTypeError
例外をスロー:
datetime_columns = ['my_dates']
for c in datetime_columns:
df[c] = pd.to_datetime(df[c], infer_datetime_format=False)
変換が仕事をしていません:私はdatetime型に変換し、私の分析で使用するためには、次のように
features = df[list(feature_columns)] # Includes 'my_dates'
labels = df[list(target_columns)]
cross_val_score(LinearRegression(), features.values, labels.values, cv=5)
TypeError: float() argument must be a string or a number
すべて私の他の列(my_datesなし)数値形式を持っています。
print list((set(features.dtypes).union(set(labels.dtypes))))
[dtype('int8'), dtype('int64'), dtype('float64')]
このエラーは、 'my_dates'列が機能に含まれている場合にのみ発生します。 cross_val_score()
はタイムスタンプでは動作しないようですが、私の分析ではそれが必要です。それを機能させるにはどうしたのですか?
を) '? – MaxU
@MaxU stringは、同じTypeErrorを返します。 – Ana
次の出力をポストすることができます: 'print(features.dtypes); print(labels.dtypes) ' – MaxU