私が持っているint
のパンダ
a = np.array([1,2,3,5,7,10,13,16,20])
pd.Series(a)
0 1
1 2
2 3
3 5
4 7
5 10
6 13
7 16
8 20
今私はグループにシリーズをクラスタ化することで、それぞれのグループで構成されているpandas
Series
2つの隣接値間の差は、<=
距離である。距離は1
として定義されている場合、距離は2
ある場合、例えば、我々は、我々は、距離が3
ある場合、我々は
[1,2,3,5,7,10,13,16], [20]
を有する
[1,2,3,5,7], [10], [13], [16], [20]
を
[1,2,3], [5], [7], [10], [13], [16], [20]
有していますどのようにpandas
/numpy
を使用してこれを行うには? 、私は、スタートを得るためにzip
を使用してインデックスを停止してからスライスを示唆している、パフォーマンスのために
def splitme(a,d) :
return list(map(list,np.split(a,np.flatnonzero(np.diff(a)>d)+1)))
- リストの機能出力にリストとして
np.split(a,np.flatnonzero(np.diff(a)>d)+1)
-