可変時間間隔に基づいて行をグループにグループ化したい。 しかし、グループ化するときには、日付部分を無視したいので、時刻の日付に基づくグループのみを無視します。Pandaグループのdatetime型に基づいたデータフレームは、異なる期間で日付を無視する部分
5分ごとにグループ化したいとします。
timestampe val
0 2016-08-11 11:03:00 0.1
1 2016-08-13 11:06:00 0.3
2 2016-08-09 11:04:00 0.5
3 2016-08-05 11:35:00 0.7
4 2016-08-19 11:09:00 0.8
5 2016-08-21 12:37:00 0.9
into
timestampe val
0 2016-08-11 11:03:00 0.1
2 2016-08-09 11:04:00 0.5
timestampe val
1 2016-08-13 11:06:00 0.3
4 2016-08-19 11:09:00 0.8
timestampe val
3 2016-08-05 11:35:00 0.7
timestampe val
5 2016-08-21 12:37:00 0.9
時間が同じ5分間隔内である限り、行は日付に関係なくグループ化されます。
私はTimeGrouperを試しました。これは日付を考慮に入れました。また、タイムパーティションだけで追加の列を作成しようとしましたが、何とかTimeGrouperをもう使用できなくなりました。 – 9blue
未回答の質問があります。最初の観察から5分間隔を開始しますか?意味は、最初の観測は11:03で、11:08までのすべての行を取得します。もしそうなら、11時03分から11時45分、11時07分、 11時03分と11時07分をグループ化し、次のグループは11時45分で開始しますか?または、最初に時間単位でソートしますか?そうであれば、最初の行の時刻は任意です。または、1日を5分の窓に分けることに満足していますか? – piRSquared
@piRSquared 1日を5分のウィンドウに分割します。 – 9blue