2017-10-16 4 views
1

私は19列と18484のrawを持つDataprepというデータフレームを持っています。私は以下のコードを望んでいた列を集計しています集計とgroupbyをPythonでDataFrameに適用するにはどうすればいいですか?

Dataprep.groupby('CustomerKey').OrderQuantity.agg('count') 

CustomerKeyは、顧客とorderquantityのID番号が各顧客による注文の数です。 1

11000 - - 1

11000 - 1

11000 - 1

11001から1

11001から1

データは

11000のように見えます11001 - 1

11001から1

11002から1

11002から1

11002から1

11002から1

11002から1

11003から1

11003 - 1

11003から1

11003から1

11003から1

11004から1

11004から1

11004から1

11004から1

最初の列はcustomerkeyであり、他の列はorderquantityです。

私の質問は、これをDataFrame Dataprepにどのように適用するかです。私は他のすべての列を保持したい。

おかげ

答えて

1

あなたがtransform必要なようだ:あなたの迅速な応答を

Dataprep['new'] = Dataprep.groupby('CustomerKey').OrderQuantity.transform('count') 
+0

感謝を。はい、私は新しいコラムを持っています。それは、11000-4,11000-4,11000-4,11000-4,11001-4,11001-4,11001-4,11001-4,11002-4,11002-4,11002-4,11002-4を示している私は11000-4,11001-4,11002-4などを探しています。私はそれを得ることができる方法は何ですか? –

+0

あなたの質問に解決策が必要です、新しい列の重複データを変換します。 – jezrael

+0

Dataprepを他のデータフレームとマージすると、私が探していたものが得られます。これまでのあなたの助けてくれてありがとう、jezreal。 –

関連する問題