2017-06-22 12 views
1

今日の午前8時から明日07時までの毎日のイベント時刻を記録するパンダデータフレームがあります日付の値を追加したり、ストレージを保存したり、単にそれを作成したりするのは嫌です。だから、それは次のようになります。パンダでdiff(ピリオド= 1)を使用して時間間隔を計算するとエラーが発生する

>>> df.Time[63010:] 
63010 23:59:59.431256 # HH:MM:SS.ffffff 
63011 23:59:59.431256 
63012 23:59:59.431256 
63013 23:59:59.431256 
63014 23:59:59.431256 
63015 23:59:59.618764 
63016 23:59:59.821756 
63017 23:59:59.821756 
63018 23:59:59.821756 
63019 23:59:59.821756 
63020 00:00:00.025058 # date changes here 
63021 00:00:00.025058 
63022 00:00:00.025058 
63023 00:00:00.228202 
63024 00:00:00.228202 
63025 00:00:00.228202 
63026 00:00:00.228202 
..... 

私は、各イベント間の時間間隔を記録し、新たなデータフレームを作りたいので、私が試した:

>>> TimeDiff = df.Time.diff(periods=1) 
しかし、それは私にはない値を取得します取得しようとする:

63018     00:00:00 
63019     00:00:00 
63020 -1 days +00:00:00.203302 <-- -1 days? 
63021     00:00:00 
63022     00:00:00 

私は日付の値を持っていないので、それが起こることがわかります。日付を追加せずにこの問題を解決するにはどうすればよいですか?

答えて

1

あなたのエラーが原因欠落している日付値にあることを知っているなら、あなたは機能to_datetimeで構築パンダを試してみてください:

例:df['date_col'] = pd.to_datetime(df['date_col'])

あなたもフォーマットを追加することによって、日付の書式を調整することができます次のような引数:

例:df['date_col'] = pd.to_datetime(df['date_col'], format="%m/%d/%Y)

+0

ありがとうございました! – maynull

関連する問題