2016-09-23 13 views
0

私は30分間隔で索引を付けなければならないデータ値の表を持っており、私はそれらをPandasとNumpyで処理しています。現在、それらはCSVファイルであり、read_csvを使用して、interval-endpointだけをインデックスとしてデータフレームにインポートします。私はそれに不快で、インターバルをインデックスとして持ちたいと思っています。Pandas TimeDeltaIndex、PeriodIndex、またはDateTimeIndexを30分間隔で使用できますか?

DateTimeIndexPeriodIndexTimedeltaIndexのいずれを使用するかわかりません...それらはすべて実際には私と非常によく似ています。私の操作が

  • 特定の間隔でのDateTimeが含まれているかどうかの確認特定の間隔
  • を見上げる交差点および(セット)の間隔
  • スプリットの違いを

    • を含めると間隔
    に参加します

    パンダでこれらのすべてを行うことはできますか?それはお勧めですか?私はすでにthis interval libraryを使用していますが、Pandas tslibperiodを使用する方が良いでしょうか?あなたはわずか30分の時間間隔でシリーズを必要とする場合

  • 答えて

    0

    あなたはこれを行うことができます。

    import pandas as pd 
    import datetime as dt 
    
    today = dt.datetime.date() 
    yesterday = dt.datetime.date()-dt.timedelta(days=1) 
    time_range = pd.date_range(yesterday,today, freq='30T') 
    

    あなたは、このようなインデックスを設定するためにそれを使用することができますが

    pd.DataFrame(0, index=time_range,columns=['yourcol']) 
    
    Out[35]: 
            yourcol 
    2016-09-25 00:00:00  0 
    2016-09-25 00:30:00  0 
    2016-09-25 01:00:00  0 
    2016-09-25 01:30:00  0 
    2016-09-25 02:00:00  0 
    

    これは次のようになりますがありますDateTimeIndex

    あなたがここにパンダの時間間隔についての詳細を読むことができます:http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases

    +0

    しかし、それは私です私は操作上(質問に記載されているように)行うことができるという意味では、nterval?交差点や差異のように?各個別の間隔には、開始点と終了点が見つかるような識別情報がありますか? –

    関連する問題