1
私は1M行のDataFramesをdictに変換する必要があります。標準的なパンダの方法はかなり長いです。Python pandasでは、データフレームの変換速度を向上させる方法はありますか?
import pandas as pd
import numpy as np
df = pd.DataFrame(data={"col": np.ones(100000)})
%time dict = df.to_dict(orient="index").values()
CPU times: user 5.88 s, sys: 81.3 ms, total: 5.96 s
Wall time: 6.23 s
このプロセスの速度を向上させる方法はありますか?
値が必要な場合は、 'df.to_dict(orient =" r ")'を使用してください。 –
なぜこれが必要ですか?目的を知ることができますか?私はなぜ個々のすべての行を辞書として意味するのですか? – Dark
私はここで簡単に説明したフォーマット 'table'を持つJSONとして入力データを取り込む関数を持っています(https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_json.html)。日付を管理し、列を列挙し列挙する。私はテスト目的のために大規模なCSVからロードされたデータフレームからこのデータフォーマットを生成する必要があります。私のテストは、今すぐデータ準備に時間がかかります。 @cᴏʟᴅsᴘᴇᴇᴅの提案はすでに改善されています! – vwrobel