2017-03-20 13 views
0

みなさんこんにちは皆私は1か月分の分データを取り、それを1時間ごとに平均化するコードを実行しています。コードは、私のファイルのいくつかで動作しますが、他のものでは動作しません。非常に大きなエラーが発生し、「集計する数値型がありません」と表示されます。エラーは、df = df.resample( '1H')。mean()行から来ています。Pythonエラーdf.resampleを使用しようとしたときに「集計する数値型がありません」

ここに私が使用しているデータがあります。ここで

https://www.dropbox.com/s/k8c77572an2pk8n/OCTTEST.csv?dl=0 

私が使用していたコードです。

import pandas as pd 

df = pd.read_csv("octtest.csv", index_col="DateTime", parse_dates=True, low_memory=False) 
df = df.resample('1H').mean() 
df = df.reindex(pd.date_range(df.index.min(), df.index.max(), freq="1H")) 
df.to_csv('output.csv', index=True, index_label="DateTime") 

答えて

1

NaN値がパラメータna_valuesのデフォルト値ものではありません、Nullあるという問題があるので、docsそれを追加必要があります。

df = pd.read_csv("octtest.csv", 
        index_col="DateTime", 
        parse_dates=True, 
        na_values='Null', 
        keep_default_na=False) 
+1

私は同意しません。 OPは 'low_memory = False'を必要としません - 実際問題は最初に問題を明らかにしていた警告を抑制していました。 – DSM

+0

確かに、私はそれを削除します。 – jezrael

+0

@DSM - ありがとうございます。 – jezrael

関連する問題