は、私はこののpythonパンダ -
のようなサンプルデータを持っていると私はdesc1とdesc2のサンプルテキストと要約データフレームを生成したいと言う(のmysql GROUP_CONCATに類似)ユニーク数、説明テキストのサンプルを取得します(約20,000行)
desc3、desc4などのような列がありますが、結果に追加のdesc_nサンプルを含めることができます。
目的は、ユニークなdesc1の他のフィールドのためのサンプルテキスト連結され、カウントを参照
は、私はこののpythonパンダ -
のようなサンプルデータを持っていると私はdesc1とdesc2のサンプルテキストと要約データフレームを生成したいと言う(のmysql GROUP_CONCATに類似)ユニーク数、説明テキストのサンプルを取得します(約20,000行)
desc3、desc4などのような列がありますが、結果に追加のdesc_nサンプルを含めることができます。
目的は、ユニークなdesc1の他のフィールドのためのサンプルテキスト連結され、カウントを参照
あなたが行うことができます。..一意の名前が(によってグループ)であるかのアイデアを得ることですこのような何か:
# customized aggregation function
join_unique = lambda x: ','.join(set(x))
# aggregate columns desc1 and desc2 respectively
df1 = df.groupby('name').agg({'desc1': [join_unique, 'nunique'], 'desc2': join_unique})
# rename columns
df1.columns = ['_'.join(x) if x[1] == 'nunique' else x[0] + "_samp" for x in df1.columns]
df1 # call reset_index() if necessary
優秀な!!! ...私は、私の実際のデータで使用するための良い理解を得るために、これ以上練習する必要があります。ありがとうございました。 – ihightower
[この](http://stackoverflow.com/questions/20109391/how-to-make-good-reproduを読みますcible-pandas-examples)が良いパンダの質問に役立つかもしれません。 – DSM