2017-08-21 23 views
-2

基本的に、私は何千ものデータを含むExcelファイルを使用しています。私はファイルを読み込むためにパンダを使用しています。Groupby to Pandasのデータフレーム

import pandas as pd 
agg = pd.read_csv('Station.csv', sep = ',') 

は、その後、私は何をしたか私はGROUPBYは平均値、中央値またはなどを数えるが、ただの観点でデータを集計するために使用されることはありません、これらのカテゴリに応じて

month_station = agg.groupby(['month','StationName']) 

データをグループ化しました月および駅名。 これは質問です。

ここで、month_stationをExcelファイルに出力したいので、最初にgroupbyをデータフレームに転送する必要があります。

私が見てきた例:

pd.DataFrame(month_station.size().reset_index(name = "Group_Count")) 

しかし、事はある、私は私のデータのサイズ/数を必要としますが、単に数を必要としない月と駅の名前の面でそれをグループ化していませんまたは並べ替えます。私はサイズを取り除こうとしました()と私にエラーが発生します。

month_stationのコンテンツをデータフレームに移植して、先に進んでcsvファイルとして出力することはできますが、複雑に思えました。

+0

「set_index( "your_index_name") '? – RHSmith159

+0

@ RHSmith159どこでしょうか? pd.DataFrame(month_station.set_index( "name"))? – Maxxx

+0

私は100%は確信していませんが、 'new_df = month_station.set_index(" name ")' – RHSmith159

答えて

0

groupbyの性質は、平均や数、合計などの集計計算を導くことができるようにするためです。月と駅の名前の各ペアを確認するだけの場合は、次を試してみてください。

month_station = agg.groupby(['month','StationName'],as_index=False).count() 
month_station = month_station['month','StationName'] 
関連する問題