2016-08-01 7 views
0

Hereの処理されたデータフレームにヘッダを追加することは私のデータセットです。パンダの

私は、以下のように.groupbyと.sizeメソッドを使用して、前のデータフレーム(データ)から新しいpandasデータフレーム(ptocol)を作成しています。これは予期したとおりに動作しますが、結果は列ヘッダーのないデータフレームになります。

非常に長い間、hereの解決策を試してみました。しかし、それは私のためには機能しません。以下は私のコードです。

import pandas as pd 
import numpy 

data = pd.read_csv('first.csv') 
ptocol = data.groupby(["Protocol"], as_index=False).size().rename(columns={0:'NumOfPackets'}) # dosn't work 
#ptocol = data.groupby(["Protocol"], as_index=False).count() #doesn't work 
print ptocol 
ptocol.to_csv('protocol.csv') 

実際の結果(protocol.csv):

0x200e,26 ARP,100746 ATMTCP,48 BOOTP,123 BZR,4 ... ... 

期待される結果

(protocol.csv):

Protocol,NumOfPackets 
0x200e,26 
ARP,100746 
ATMTCP,48 
BOOTP,123 
BZR,4 
... 
... 

任意のアイデア/提案は歓迎されている

答えて

0

.size()あなたは、データフレームに変換するreset_index()を使用することができ、Seriesオブジェクトを返し、代わりにこれを試してみてください。

ptocol = data.groupby("Protocol").size().rename('NumOfPackets').reset_index() 
ptocol.to_csv('protocol.cv', index = False) 

これはあなたのように、このようなものではなく、同じデータを提供しますが、フォーマットは、あなたが探しているものです:

Symbol,NUM 
A,5 
AA,5 
AAAP,5