大きなデータフレームdf
があります。indices
の固有リストがdf.index
にあります。 indices
に要素で索引付けされたすべてのサブデータフレームのリストを作成する必要があります。 (df
約3e6
行、および3e3
ユニークなインデックスを持っている)ものの、具体的にこのコマンドを実行するパンダのデータフレームをサブデータフレームのリストに分割する最も速い方法
list_df = [df.loc[x] for x in indices]
は年齢を取っています。これはこの操作を実行するのに合理的な方法ですか?この問題や関連する問題のパフォーマンスを向上させることができるようなコメントや提案をいただければ幸いです。
ありがとうございます!あなたは、インデックスによってgroupby
オブジェクトにリストの内包表記を使用することができます
をdownvoterは私がどのように知っていることができれば、私は喜んでいるだろう私の質問を改善する。ありがとう! –