2017-03-13 14 views
0

は、私はこののpythonパンダ -

enter image description here

のようなサンプルデータを持っていると私はdesc1とdesc2のサンプルテキストと要約データフレームを生成したいと言う(のmysql GROUP_CONCATに類似)ユニーク数、説明テキストのサンプルを取得します(約20,000行)

desc3、desc4などのような列がありますが、結果に追加のdesc_nサンプルを含めることができます。

enter image description here

目的は、ユニークなdesc1の他のフィールドのためのサンプルテキスト連結され、カウントを参照

+2

[この](http://stackoverflow.com/questions/20109391/how-to-make-good-reproduを読みますcible-pandas-examples)が良いパンダの質問に役立つかもしれません。 – DSM

答えて

3

あなたが行うことができます。..一意の名前が(によってグループ)であるかのアイデアを得ることですこのような何か:

# customized aggregation function 
join_unique = lambda x: ','.join(set(x)) 

# aggregate columns desc1 and desc2 respectively 
df1 = df.groupby('name').agg({'desc1': [join_unique, 'nunique'], 'desc2': join_unique}) 

# rename columns 
df1.columns = ['_'.join(x) if x[1] == 'nunique' else x[0] + "_samp" for x in df1.columns] 

df1 # call reset_index() if necessary 

enter image description here

+0

優秀な!!! ...私は、私の実際のデータで使用するための良い理解を得るために、これ以上練習する必要があります。ありがとうございました。 – ihightower