私はDateTimeIndex
とindex
とMultiIndex
としてcolumns
とDataFrame(毎日の複数の時系列)を持っています。私は、列を選択し、年ごとにデータをグループ化するBox Plotを作成したいと思います。私はそれが簡単だと思ったが、私はいくつかの結果を得るのに苦労している。年1回BoxPlots with Pandas
>>> daily.shape
(11319, 118)
>>> daily.index
DatetimeIndex(['1986-01-01', '1986-01-02', '1986-01-03', '1986-01-04',
'1986-01-05', '1986-01-06', '1986-01-07', '1986-01-08',
'1986-01-09', '1986-01-10',
...
'2016-12-22', '2016-12-23', '2016-12-24', '2016-12-25',
'2016-12-26', '2016-12-27', '2016-12-28', '2016-12-29',
'2016-12-30', '2016-12-31'],
dtype='datetime64[ns]', name='timevalue', length=11319, freq=None)
>>> daily.columns
MultiIndex(levels=[['41B001', '41B004', '41B006', '41B008', '41B011', '41MEU1', '41N043', '41R001', '41R002', '41R012', '41WOL1', '41WOL2', '47E013', 'T1M001', 'T1M003'], ['BA-10.0', 'BA-2.5', 'BC', 'CO', 'CO2', 'NO', 'NO2', 'NOx', 'O3', 'PM-10.0', 'PM-2.5', 'RH', 'SO2', 'T', 'UVPM', 'VO-10.0', 'VO-2.5', 'WD', 'WS-s', 'WS-v', 'p']],
labels=[[0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 11, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 14], [5, 6, 7, 3, 5, 6, 7, 8, 3, 5, 6, 7, 8, 3, 5, 6, 7, 12, 0, 1, 5, 6, 7, 8, 9, 10, 15, 16, 0, 1, 5, 6, 7, 9, 10, 15, 16, 0, 1, 2, 3, 5, 6, 7, 8, 9, 10, 12, 14, 15, 16, 0, 1, 2, 3, 5, 6, 7, 8, 9, 10, 12, 14, 15, 16, 2, 3, 4, 5, 6, 7, 12, 14, 0, 1, 2, 4, 5, 6, 7, 8, 9, 10, 12, 14, 15, 16, 0, 2, 3, 4, 5, 6, 7, 8, 9, 12, 14, 15, 4, 5, 6, 7, 12, 11, 13, 13, 17, 18, 19, 20, 11, 13, 13, 17, 18, 19, 20]],
names=['sitekey', 'measurandkey'])
私が達成できる最高は次のとおりです。
fig, axe = plt.subplots()
daily.loc[:,[('41R001', 'SO2')]].groupby(daily.index.map(lambda x: x.year)).boxplot(ax=axe, subplots=False, rot=90)
しかし、それはラベリング軸の他の後処理を必要とします。
reset_index()
に関数を適用し、pivot()
を使用しようとすると、MultiIndex
が原因でインデックスエラーが発生します。
d = daily.reset_index()
d['timevalue']
例外は次のとおりです。一意でない複数のインデックスを処理できません!私のマルチインデックス内のTimeValueが発生していないので、私は理解していないこと。私はまた、.loc[]
を試してみましたが、私はこの問題は、他の場所だと思います。
だから、私は何を達成するであろうことは簡単です:
- 私は数年の間、毎日時系列を持っており、それらの時系列は、マルチインデックス付けされています。
- 私は(
loc
と、上記の例のように、複合キーを使用して)それらのいずれかを選択し、データは年によってグループ化されtimeserie箱ひげ図を取得したいと思います。
mutli-indexエラーのため、このDataFrameでpivot()
を正しく使用することはできません。