私は4年間のデータを含むcsvファイルを持っており、4年間にわたってシーズンごとのデータをグループ化しようとしています。シーズンのみ。 ここに私のデータファイルの表情だ。ここ正確な日付に基づいてシーズン別にデータをグループ化する
timestamp,heure,lat,lon,impact,type
2006-01-01 00:00:00,13:58:43,33.837,-9.205,10.3,1
2006-01-02 00:00:00,00:07:28,34.5293,-10.2384,17.7,1
2007-02-01 00:00:00,23:01:03,35.0617,-1.435,-17.1,2
2007-02-02 00:00:00,01:14:29,36.5685,0.9043,36.8,1
2008-01-01 00:00:00,05:03:51,34.1919,-12.5061,-48.9,1
2008-01-02 00:00:00,05:03:51,34.1919,-12.5061,-48.9,1
....
2011-12-31 00:00:00,05:03:51,34.1919,-12.5061,-48.9,1
とです私の所望の出力:
names =["timestamp","heure","lat","lon","impact","type"]
data = pd.read_csv('flash.txt',names=names, parse_dates=['timestamp'],index_col=['timestamp'], dayfirst=True)
spring = range(80, 172)
summer = range(172, 264)
fall = range(264, 355)
def season(x):
if x in spring:
return 'Spring'
if x in summer:
return 'Summer'
if x in fall:
return 'Fall'
else :
return 'Winter'
data['SEASON'] = data.index.to_series().dt.month.map(lambda x : season(x))
data['impact'] = data['impact'].abs()
seasonly = data.groupby('SEASON')['impact'].mean()
と私はこの恐ろしい結果を得た:実際に私はこのコードを試してみた
winter (the mean value of impacts)
summer (the mean value of impacts)
autumn ....
spring .....
:
私は間違っていますか?
ええ、それは働いています、@ jezrael –
@ piRSquaredありがとう、ありがとう、私はそれに取り組んでいます。 – jezrael