のpythonパンダ - - 優秀な図書館

のようなサンプルデータを持っていると私はdesc1とdesc2のサンプルテキストと要約データフレームを生成したいと言う（のmysql GROUP_CONCATに類似）ユニーク数、説明テキストのサンプルを取得します（約20,000行）

desc3、desc4などのような列がありますが、結果に追加のdesc_nサンプルを含めることができます。

目的は、ユニークなdesc1の他のフィールドのためのサンプルテキスト連結され、カウントを参照

2017-03-13 ihightower

[この]（http://stackoverflow.com/questions/20109391/how-to-make-good-reproduを読みますcible-pandas-examples）が良いパンダの質問に役立つかもしれません。 – DSM

あなたが行うことができます。..一意の名前が（によってグループ）であるかのアイデアを得ることですこのような何か：

# customized aggregation function 
join_unique = lambda x: ','.join(set(x)) 

# aggregate columns desc1 and desc2 respectively 
df1 = df.groupby('name').agg({'desc1': [join_unique, 'nunique'], 'desc2': join_unique}) 

# rename columns 
df1.columns = ['_'.join(x) if x[1] == 'nunique' else x[0] + "_samp" for x in df1.columns] 

df1 # call reset_index() if necessary

出典

2017-03-13 17:11:57 Psidom

優秀な!!! ...私は、私の実際のデータで使用するための良い理解を得るために、これ以上練習する必要があります。ありがとうございました。 – ihightower

のpythonパンダ -

答えて

関連する問題