2017-04-07 6 views
0

.RDSフォーマットの最も近いペンダント/代替品はどれですかknown from RPythonそれぞれPandas DataFramePython&Pandas:R/dplyr .rdsフォーマットのペンダント

DataFrame documentationに記載されているように私はto_pickle()を試しましたが、同じ内容を保持している対応する.csvファイルよりも小さいという特性に欠けています。

df = pd.get_dummies(pd.Series(list('abca'))) 
df.to_csv("tmp.csv")  # 44 Bytes 
df.to_pickle("tmp.pickle") # 682 Bytes 

私はパンダDataFrame Sをシリアル化(デ)への道は(.CSVに比較ですしてディスクスペースを節約する)速い(時間の書き込みを保存し、.CSVに比較ですの読み込み)と圧縮を探しています。

ありがとうございました。

答えて

0

パンダはHDF5にエクスポートできます。これはCSVよりも高速でコンパクトです。混合型では問題が発生することもありますが、CSVにも問題があります。

ファイルサイズと小さなデータセットとの比較にも注意する必要があります。圧縮のオーバーヘッドにより、小さなデータセットのファイルが大きくなる可能性があります。

関連する問題