私はパンダとかなり複雑なgroupby操作を実行しようとしています。 2つのデータフレームを検討:groupbyの範囲の範囲 - パンダ
df1:
begin, end, y
0, 3, string10
3, 7, string11
df2:
begin, end, x
0, 2, string1
1, 2, string2
3, 4, string3
4, 6, string4
この二DFは、いくつかの特性を有するタイムスロットを表します。 DF1は大きなタイムスロットを含み、その境界線は常にDF2より大きい。 また、DF2の各begin endは、常にDF1のタイムスロットの1つに含まれるか、または等しくなります。 Pandas Groupby Range of Values
:私はチェックしてみましたresult:
index, slot, begin_df2, end_df2, x, y
0, (0,3), 0, 2, string1, string10
, (0,3), 1, 2, string2, string10
1, (3,6), 3, 4, string3, string11
, (3,6), 4, 6, string4, string11
私は、このためのパンダのAPIで、合理的な流れを見つけることができません。私がする必要がどのような
はDF1スロットに保ち、その性質に応じてグループDF2にあります
しかし、ある範囲内の単一の値をグループ化する方がますます重要になります。
は、グループ化、複数のレベルを試してみてください - https://stackoverflow.com/questions/42998660/pandas-how-to-groupby-with-count -with-multiple-levels-on-rows – Tanu