2016-04-29 4 views
1
date   object 
lat   float64 
lon   float64 
speed  float64 
direction float64 

によって大GPSデータをグループ化、日付は、オブジェクト・タイプとして日付を示すフォーマット2016-04-29 11:45:21 を下記のものです。 1分ごとに10以上のレコードがあります。だから、一緒にグループ化し、1分のGPSデータごとに平均速度を適用したい。 私はdatafileがpandasデータフレームである次のコードを試してみます。私<code>csv</code>ファイルの1分間

datafile.groupby(pd.TimeGrouper('1Min'))['speed'].mean() 

次のエラーが来る:

TypeError: axis must be a DatetimeIndex, but got an instance of 'Int64Index'


datafile.headその後、コメントのように編集した後、()今私は1069件のレコードが06からあるtable outputtaxi table output after datafile.head()

を示しています。 35:20〜06:59:59しかし、あなたはおそらくparse_dates=Trueを使用して、組み込み.read_csv()機能を利用することができます

df.index = pd.to_datetime(df.loc[: 'date'], format='%Y-%m-%d %H:%M:%S') 

をして:私はあなたが使用してdata列からDateTimeIndexを作成する必要が1分ごとにデータの速度の平均

答えて

1

を見つける必要がありますindex_col=0dateとし、indexと入力してからindex(日付は最初にcolumnとする)を解析します。

+0

ですが、日付は2013-12-16 06:35:20の1970-01-01 00:00:00です。 2013年の –

+0

は 'df.head()'の表示に役立ちます。 updateを参照してください。おそらく '.read_csv()'を最適化して読み込み時に日付を正しく解析することができます。http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html – Stefan

+0

まだ分​​かりませんでした。これを何時間も塞いでいる。上記のコマンドを使用すると、出力は次のようになります。 1970-01-01 00:00.000000000 \t 2013-12-16 06:35:20 \t速度96 は1069レコードで構成されています。最後のレコードは 1970-01-01 00:00.00.000001068 \t 2013-12-16 06:59:59 \tスピード78 これは、上記のコードでグループ化してから1分でグループ化する方法です値.. –

関連する問題