2016-08-06 3 views
1

pandasを使用すると、各リサンプリングされたビン内のサンプル数を追跡できますか?例えばパンダを使用して各ビン内のサンプル数を追跡するpd.resample

サンプルデータ所与:time_scale 5分にリサンプリングで

2000-01-01 00:00:00 1 
2000-01-01 00:01:00 2 
2000-01-01 00:06:00 3 

を、最初のバーを作成するために使用される2つのサンプル、及び第二のバーを作成するために使用される1個のサンプルが存在するであろう、私が希望しますこれを追跡する。

私が探していた結果が

index     val count 
2000-01-01 00:00:00 1.5 2 
2000-01-01 00:05:00 3.0 1 
+0

問題の詳細を投稿できますか?問題と目標は何ですか? – SO44

+1

'df.resample( '5T')。count()'? – ayhan

+0

@ayhanこれは、完全なサンプルの行数を通知するだけです。私の例を更新してもっと明瞭にするようにしましょう – pyCthon

答えて

1

これはあなたのデータフレームであると仮定し、次のようになります。

df 
Out: 
        C1 
2000-01-01 00:00:00 1 
2000-01-01 00:01:00 2 
2000-01-01 00:06:00 3 

あなたは.aggを使用してグループに複数の機能を適用することができます。

df.resample('5T')['C1'].agg({'val': 'mean', 'count': 'count'}) 
Out: 
        count val 
2000-01-01 00:00:00  2 1.5 
2000-01-01 00:05:00  1 3.0 

count各グループの観測数をカウントし、valがその手段です。

+0

'df.resample(time_frame = '5T'、how = 'OHLC')' – pyCthon

+1

を持っている場合はどうでしょうか?ohlcは最初、最後、 'dt.resample( '5T')['C1'] .gg( 'first'、 'max'、 'min'、 'last'、 'count'])'またはconcat結果は次のようになります:pd.concat([dt.resample( '5T').htlc()、df.resample( '5T')['C1'] .gag( 'count')]、axis = 1) ' – ayhan

関連する問題