パンダのデータフレームに格納し、我々はこの単純な表から開始したとしますパンダの.groupbyとは逆の "ungroup by"操作がありますか?
def name_join(list_names, concat='-'):
return concat.join(list_names)
:
name age family
0 john 1 1
1 jason 36 1
2 jane 32 1
3 jack 26 2
4 james 30 2
その後、私はname_join
は、名前のための簡単な集約関数である
group_df = df.groupby('family')
group_df = group_df.aggregate({'name': name_join, 'age': pd.np.mean})
を行います
出力は:
age name
family
1 23 john-jason-jane
2 28 jack-james
今質問です。
集計された表から次の項目に素早く効率的にアクセスできますか?
name age family
0 john 23 1
1 jason 23 1
2 jane 23 1
3 jack 28 2
4 james 28 2
(注:数値は単なる一例であり、私はこの特定の例では平均化した後、私は失っていた情報のために気にしない)
私はそれがあまりにも効率的に見えない何ができると思った道:
- 名
- は、できるだけ多くの行でデータフレームを返す分離、
group_df
内のすべての行から空のデータフレーム - を作成開始行
- 内の名前が空のデータフレーム
[pandas:列内のテキストを複数の列に分割するにはどうすればいいですか?](http://stackoverflow.com/questions/17116814/pandas-how-do-i-split-text-in-a複数の列に列) –