はパンダで空のセルの間に充填されたセルの下

の数をカウントし、私のデータフレームの一部の例である：私は空のセル間の非空のセルの数をカウントする列col1内のすべてのユニークな値のために必要なはパンダで空のセルの間に充填されたセルの下

col1  col2 
items1 10 
items1  5 
items1  3 
items1  2 
items1 NaN 
items1 NaN 
items1 NaN 
items1  4 
items1  1 
items1  1 
items2  6 
items2  4 
items2  5 
items2 NaN 
items2 NaN 
items2  2 
items2  8 
items2  7 
items2  9 
items2 NaN 
...

。私は、col1とcount()の一意の値をグループ化するためにgroupby()を使用して、値をカウントしようとしましたが、一意の値のすべての空でない値をcol1に数えます。ここで

は私のコードです：

df = pd.DataFrame({'col1':('items1','items1','items1','items1','items1','items1','items1','items1','items1','items1','items2','items2','items2','items2','items2','items2','items2','items2','items2','items2'), 
        'col2': (10, 5, 3, 2, np.nan, np.nan, np.nan, 4, 1, 1, 6, 4, 5, np.nan, np.nan, 2, 8, 7, 9, np.nan)}) 
df.groupby('col1')['col2'].count().reset_index()

結果は次のようになります。

 col1 col2 
0 items1  7 
1 items2  7

しかし、私は次のことを取得する必要があります。

 col1 col2 
0 items1  4 
1 items1  3 
2 items2  3 
3 items2  4

私は任意のために感謝されます助言！

出典

2017-12-06 Yana Dolyuk

IIUC、PS：私はそれがロングコードtoooを行いますreset_index()を追加しませんでした。..

df.groupby([df['col1'],df['col2'].isnull().diff().fillna(0).cumsum()])['col2'].count().replace(0,np.nan).dropna() 
Out[885]: 
col1 col2 
items1 0  4.0 
     2  3.0 
items2 2  3.0 
     4  4.0 
Name: col2, dtype: float64

出典

2017-12-06 15:35:06 Wen

はパンダで空のセルの間に充填されたセルの下

答えて

関連する問題