2016-07-17 13 views
1

私はこの巨大なcsvファイルにtimedim、unblendedcostなどの名前の列があります。私は私がパンダでこれをロードして、このSQL文と同じです。何かをやろうと、SQL文のPandas代替語

用法がデータベースに

私のテーブルでSELECT合計日まで用途グループから(unblendedcost)、timedim(timedim)していますCSVをデータベースにロードしようとしましたが、その600万行ほどでした。 すべてのヘルプは非常にそれが必要のように見える

答えて

1

を理解されるであろう:列timedimdtypeは、使用、時間情報を持つ日時である場合

usages.groupby('timedim', as_index=False)['unblendedcost'].sum() 

usages.unblendedcost.groupby(df.timedim.dt.date, as_index=False).sum() 

サンプル:

import pandas as pd 

usages = pd.DataFrame({'timedim':[1,1,3,3], 
         'unblendedcost':[1,2,3,4], 
         'a':[7,8,9,8]}) 

print (usages) 
    a timedim unblendedcost 
0 7  1    1 
1 8  1    2 
2 9  3    3 
3 8  3    4 

print (usages.groupby('timedim', as_index=False)['unblendedcost'].sum()) 
    timedim unblendedcost 
0  1    3 
1  3    7 
+0

おい、あなたはスーパースターです。大変ありがとうございました。 –

+0

私の解決策があなたが望むものなら、サンプルを見てください。 – jezrael