2017-08-14 4 views
0

私はPandas DataFrameへの集計の後に行うためのpandas構文を探しています。私はパンダでSQLクエリを実行する方法の例を見つけることができません。もっと複雑なSQLクエリのためのpandas構文

#sum and divide 
select 
click, 
ctr, 
SUM(click)/SUM(imp) as ctr 
from mytable 
group by website 

#normalize each subgroup 
select 
imp, 
imp/SUM(imp) Over (partition website) as n_imp 
from mytable 
+0

サンプルデータセットを提供し、所望のデータが 'click'と' ctr'がでないように、第1のSQLがerronousあるIMO – MaxU

+0

を設定してくださいグループ句 – MaxU

答えて

1

SQL:

#normalize each subgroup 
select 
imp, 
imp/SUM(imp) Over (partition website) as n_imp 
from mytable 

パンダ:

df[['website','imp']].assign(n_imp=df['imp']/df.groupby('website')['imp'].transform('sum')) 
0

パンダあなたはSQLでクエリを記述し、データフレームに結果を引っ張ってみましょう機能read_sqlを持っています。

関連する問題