私は、パンダが比較的遅くcsvファイルを読み込むことができる理由の1つは、型を推測する前に列の内容全体をスキャンする必要があることを理解しています非推奨low_memory
オプション、pandas.read_csv
)。私の理解は正しいのですか?パンダにデータフレームを読み込む速度を上げる方法
データフレームを格納するための適切なフォーマットとデータ型を明示的に指定するので、pandasは推測する必要はありません(SQLは現在オプションではありません)。
特に任意のオプションthose listed hereから何か?
私のデータフレームは浮動小数点型、整数型、日付型、文字列型、およびY/N型を持っているため、数値のみをサポートするフォーマットはできません。
ありがとうございます!
? –
私は数値データ(float64)のみを扱っていましたので、私は確信が持てませんが、パンダへの直接インポートよりも優れていると思います。 – Shayn