誰でも、私が思っていた以下の2つのやり方、なぜなら同じことをpandas.dataframe groupbyのという方法で、iPythonのMagic%timeitに従った別の時間で完了する理由を理解できますか?pandas.dataframe.groupbyが最初に変数に割り当てられた方が速いのはなぜですか?
%timeit somedf.groupby('someBoolColumn')['someBoolColumn'].count()
484 µs ± 9.52 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
%%timeit grp = somedf.groupby('someBoolColumn')
grp['someBoolColumn'].count()
146 µs ± 1.47 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
somedfは、7200行24列を有する。
変数GRPにオブジェクトを割り当てる2つのライナが最初> 3
倍速く、また、なぜ私は
、
-
を見つけることができません。
これがgroupbyメソッドに固有の場合は パンダやPythonの場合はさらに一般的なものです(例: 可変アサイメント)。このように任意の啓発のための
多くのおかげで、本当に私はパラメータの多くの異なる組み合わせで繰り返し、処理したいのですが、多くの非常に大きなデータフレームで役立つだろう。
Hey Jon、あなたは[この編集](https://stackoverflow.com/review/suggested-edits/18149782)でしたが、回答を編集する代わりにできることを尋ねました。これらの制限は、コメントは理由があります。[ここでは、これらの制限が存在し、代わりにできることを読むことができます](https://meta.stackexchange.com/questions/214173/why-do-i-need-50-reputation -to-comment-to-comment-what-can-i-do-代わりに)良い一日を! – jmattheis