Iデータが収集されていない隙間を持つ潮汐データのcsvファイルがあります。CSVのパンダとPython日時タイムスタンプ
datetime,tidal_water_level
2014-05-13 00:00:00,0.008
2014-05-13 01:00:00,-0.283
2014-05-13 02:00:00,-0.491
2014-05-13 03:00:00,-0.557
...
など
データフレームにそれをロードするための私の開口部の策略はこれです:
私は他のさまざまな例から一緒に入れているimport matplotlib.pyplot as plt
import datetime as dt
headers = ['timestamp', 'tide_height']
dtypes = [dt.datetime, float]
df = pd.read_csv('tides_clean.csv', names=headers, dtype=dtypes, header=1, parse_dates=True)
それはこのようになります。 dt.datetimeは理解できないと訴えます。
私はDTYPE引数を削除した場合、それは次のようになります。
df
Out[103]:
timestamp tide_height
0 2014-05-13 01:00:00 -0.283
1 2014-05-13 02:00:00 -0.491
2 2014-05-13 03:00:00 -0.557
...
は、どのように私は、むしろインデックスよりも、日時型として時系列データ自体にしてください動作することができますか?例えばプロット時間V潮ではなく、指標V潮
私が試してみてください。。 plt.scatter(X = df.timestamp、Y = df.tide_height)を 、空の1.0×1.0平方プロットプラスエラーが発生しますので、 : ValueError:最初の引数はシーケンスでなければなりません
私の究極の目標は、異なるサンプリング周波数にデータを再サンプリングすることですが、これは私の最初のハードルと思われます。
大変ありがとうございます。私はindex_colフラグの意味を理解していませんでした。この回答の結果、いくつかのことを学びました。 – DHBI