を出すようなDFがいる:列「DATが」オブジェクト型を持つパンダto_datetime()関数のパフォーマンスが
Dat
10/01/2016
11/01/2014
12/02/2013
のでI)(to_datetimeを使用してdatetime型に切り替えしようとしているパンダはそのように機能:
to_datetime_rand = partial(pd.to_datetime, format='%m/%d/%Y')
df['DAT'] = df['DAT'].apply(to_datetime_rand)
すべてうまく動作しますが、私のdfが20億行以上になるとパフォーマンスの問題が発生します。その場合、このメソッドはスタックし、うまくいきません。
pandas to_datetime()関数には、chuncksまたは繰り返しによって繰り返し変換する機能がありますか。
ありがとうございました。
日付は一意ですか?そうでない場合は、新しい日時の値と文字列を格納するためにdictを使用することができます。その前に日付が表示されていれば変換する必要はありません。さらに、 'df ['DAT'] = pd.to_datetime (df ['DAT']、format = '%m /%d /%Y') '? – EdChum
間違いなく '.apply'を使用しないでください –