pandas.DataFrame
には整数の列名があり、ゼロと1を持ちます。入力の例:連続的なものの配列(開始起こるデータフレーム内で連続したものをカウントし、インデックスが得られる場所
12 13 14 15
1 0 0 1 0
2 0 0 1 1
3 1 0 0 1
4 1 1 0 1
5 1 1 1 0
6 0 0 1 0
7 0 0 1 1
8 1 1 0 1
9 0 0 1 1
10 0 0 1 1
11 1 1 0 1
12 1 1 1 1
13 1 1 1 1
14 1 0 1 1
15 0 0 1 1
Iは> = 2であり、長さ/和を有するすべての連続したものをカウントする必要があり、列を反復し、また戻すこと指数、終わり)。
好ましい出力は3Dデータフレームで、サブカラム「count」と「indices」は入力の整数列名を参照します。
の出力例は、この1のようになります。私はそれがitertools.groupby
で解決しなければならないが、それでもこのような問題は、両方のgroupby
結果とに適用する方法を見つけ出すことができないと仮定し
12 13 14 15
count indices count indices count indices count indices
3 (3,5) 2 (4,5) 2 (1,2) 3 (2,4)
4 (11,14) 3 (11,13) 3 (5,7) 9 (7,15)
2 (9,10)
4 (12,15)
そのインデックスが抽出されています。ここ
関連性はありますが、同一ではありません:http://stackoverflow.com/q/43943369/2988730 –