2016-06-22 24 views
1

日付列のすべての固有値を抽出しようとしています。この場合、1つの値しかないので、エラーを確認するのは簡単です。pd.to_datetime()が不正な日付を返す

私はこれを見るために使用しているコードは次のとおりです。私は取得しています二つの結果が

最初の行のための
['2016-06-01'] 

['2016-05-31T20:00:00.000000000-0400'] 

ためです

print df['Date'].unique() 
print pd.to_datetime(df['Date'], format = "%Y-%m-%d").unique()) 

2行目。これを修正する方法はありますか?

編集:EdChumさんのコメントについては

コード:

import pandas as pd 
from datetime import datetime, timedelta 

archive = pd.read_csv(r'J:\xxxx\xxxx\Archive.csv') 
date_list = archive['Date'].unique() 
date_list_test = pd.to_datetime(archive['Date'], format = "%Y-%m-%d").unique() 

print date_list 
print date_list_test 

enter image description here

+2

あなたは上記を再現するために、生データとコードを投稿することができ、それが何らかの形であなたのタイムゾーンは – EdChum

+0

奇数であるオフセット導入されるように思えるちょっと@EdChum私は、内のコードを掲載質問。生データについては、それをどのように見えるか入力するだけですか?私はここに実際のCSVをアップロードできるとは思わない – FortuneFaded

+0

エラーを再現するあなたのcsvの十分な行を投稿できますか? – EdChum

答えて

1

これはnumpyは、日付を表示する方法とだけの問題である - バージョン1.11にそれが消えます。

In [55]: np.__version__ 
Out[55]: '1.10.4' 

In [56]: pd.to_datetime(['2015-05-31']) 
Out[56]: DatetimeIndex(['2015-05-31'], dtype='datetime64[ns]', freq=None) 

In [57]: pd.to_datetime(['2015-05-31']).values 
Out[57]: array(['2015-05-30T19:00:00.000000000-0500'], dtype='datetime64[ns]') 

In [58]: pd.Series(pd.to_datetime(['2015-05-31']).values) 
Out[58]: 
0 2015-05-31 
dtype: datetime64[ns] 

numpyの1.11

In [94]: np.__version__ 
Out[94]: '1.11.0' 

In [96]: pd.to_datetime(['2015-05-31']) 
Out[96]: DatetimeIndex(['2015-05-31'], dtype='datetime64[ns]', freq=None) 

In [97]: pd.to_datetime(['2015-05-31']).values 
Out[97]: array(['2015-05-31T00:00:00.000000000'], dtype='datetime64[ns]') 
+0

ちょっと@chrisbこれは間違った日付を修正しますか?私は書式変更を見るだけではありません。何らかの理由でpd.to_datetime()が6/1/16の代わりに5/31/16を返しています – FortuneFaded

+0

これは表示上の問題です - [here](https://github.com/numpy/numpy/pull)を参照してください。/6453)を参照してください。 'Series'に結果をラップしてみてください(正しいnumpy配列です)、正しい日付が表示されるはずですか? – chrisb

+0

遅れて申し訳ありませんが、numpyをインストールしようとしていて、奇妙なエラーが発生しています。私は会社のイントラネットのために手動でインストールする必要があります。 setup.pyを実行すると、SystemErrorが発生します:numpyを構築するために必要な関数の1つが利用できません(リストは['sin'、 'cos'、 'tan'、 'sinh'、 'cosh'一束以上 – FortuneFaded

関連する問題