2016-12-14 6 views
1

でいくつかの値で割るのデータフレームIは、データフレーム、私はsklearnからlinear regressionを使用して、より小さなデータフレームにそれを分割する必要があるパンダ:列

date city brand model count 
2016-02 abakan audi a6 1 
2016-02 abakan bmw 5-series 2 
2016-02 abakan bmw x5 2 
2016-02 abakan chery a15 1 
2016-02 abakan chevrolet cruze 3 
2016-02 abakan chevrolet cruze 10 

を持っています。これを行う方法はありますか、それを指定する何らかの方法がありますかlinear regression列内の異なる値を検討しますか?

date city brand model count 
2016-02 abakan audi a6 1 

date city brand model count 
2016-02 abakan bmw 5-series 2 

date city brand model count 
2016-02 abakan bmw x5 2 

date city brand model count 
2016-02 abakan chery a15 1 

date city brand model count 
2016-02 abakan chevrolet cruze 3 
2016-02 abakan chevrolet cruze 10 

どうすればいいですか?

+0

'df.goupby( 'ブランド')get_group( 'グループの名前')' ' – MMF

答えて

1

パンダソリューションはgroupbylist comprehensionである - 出力はDataFramesのリストです:

dfs = [g for i, g in df.groupby(['date','city','brand','model'])] 
print (dfs) 
[  date city brand model count 
0 2016-02 abakan audi a6  1,  date city brand  model count 
1 2016-02 abakan bmw 5-series  2,  date city brand model count 
2 2016-02 abakan bmw x5  2,  date city brand model count 
3 2016-02 abakan chery a15  1,  date city  brand model count 
4 2016-02 abakan chevrolet cruze  3 
5 2016-02 abakan chevrolet cruze  10] 

print (dfs[0]) 
     date city brand model count 
0 2016-02 abakan audi a6  1 
+0

get_group' wouldn」。仕事は? – MMF

+0

私はそう、出力に依存すると思う。 'df'のリストが必要な場合、' df1'、 'df2'、' dfn' ... – jezrael

+0

ありがとうございました! – MMF