パンダのDataFrameで作業しているのに気付いたのは、一番奇妙なことです。同じコードの1回目と2回目の実行の間にDataFrameを作成する時間が大幅に短縮されます。pythonやPandasのキャッシュ結果はありましたか?
L = list('ABCDEFGH')*20000
min_length = 10000
data_dict = {k: np.random.randint(10, size=min_length) for k in L}
start = time.time()
df = pd.DataFrame({k:v[:min_length] for k,v in data_dict.items()})
print('loop time : ', time.time() - start)
第一の実行のための時間
loop time : 0.05926999
私はすべてのボディは、ちょうど何が起こったのか説明でき
loop time : 0.00090622
上記のコードを再実行するとき?
pandasまたはpythonキャッシュの結果はありましたか?
ipythonでtimeitを実行すると、this
プログラムはファイルに保存されていますか? – JohanL
はい!何か違いはありますか? –
私はあなたもこれをiPythonでタグ付けするべきだと思います。興味深いのは、私が実際に 'timeit'でそのメッセージを見たことがないので、どの部分がキャッシュされているのかわからないからです(どのようにトレースするのか分かりません)。しかし、私はあなたの結果を再現できます。 – roganjosh