2016-03-19 17 views
0

Iデータが収集されていない隙間を持つ潮汐データのcsvファイルがあります。CSVのパンダとPython日時タイムスタンプ

datetime,tidal_water_level 
    2014-05-13 00:00:00,0.008 
    2014-05-13 01:00:00,-0.283 
    2014-05-13 02:00:00,-0.491 
    2014-05-13 03:00:00,-0.557 
    ... 

など

データフレームにそれをロードするための私の開口部の策略はこれです:

私は他のさまざまな例から一緒に入れている
import matplotlib.pyplot as plt 
    import datetime as dt 

    headers = ['timestamp', 'tide_height'] 
    dtypes = [dt.datetime, float] 
    df = pd.read_csv('tides_clean.csv', names=headers, dtype=dtypes, header=1, parse_dates=True) 

それはこのようになります。 dt.datetimeは理解できないと訴えます。

私はDTYPE引数を削除した場合、それは次のようになります。

df 
    Out[103]: 
        timestamp tide_height 
    0  2014-05-13 01:00:00  -0.283 
    1  2014-05-13 02:00:00  -0.491 
    2  2014-05-13 03:00:00  -0.557 
    ... 

は、どのように私は、むしろインデックスよりも、日時型として時系列データ自体にしてください動作することができますか?例えばプロット時間V潮ではなく、指標V潮

私が試してみてください。。 plt.scatter(X = df.timestamp、Y = df.tide_height)を 、空の1.0×1.0平方プロットプラスエラーが発生しますので、 : ValueError:最初の引数はシーケンスでなければなりません

私の究極の目標は、異なるサンプリング周波数にデータを再サンプリングすることですが、これは私の最初のハードルと思われます。

答えて

2

あなたはこれだけを行う必要があり、そしてパンダはデータ型を理解する:

import pandas as pd 

df = pd.read_csv('df.csv', parse_dates = True, index_col = 0) 

その後df.plot()はあなたにx軸上の時間と時系列プロットを与えます。

df.index.to_pydatetime() 
+0

大変ありがとうございます。私はindex_colフラグの意味を理解していませんでした。この回答の結果、いくつかのことを学びました。 – DHBI

関連する問題