to_parquet機能を実行しているときに、列オブジェクトの種類に問題があることを確認しました。私はdaskバージョン15.1を実行しています。 astype(object)を使用して明示的に列を変換しましたが、これはすべての列ではなく一部の列で役立ちました。 次のエラーが表示されます。TypeError: bad argument type for built-in operation obj
Dask(Python)とDrill(Sergeantパケットを使用している)にparquetファイルを生成しました。 R \ Drillでparquetファイルを削除することができた(これらのファイルを持っているし、代わりにparquet.crcファイルを持っていませんが(すなわちfastparquet)Daskのフォーマットは_metadataと_common_metadataファイルを持って
csvファイルをパーケットフォーマットに変換する必要があります。しかし、このcsvファイルは非常に巨大です(65,000行と1,000列以上)。そのため、私の寄木細工のファイルをいくつかのサブファイルに分割する必要があります(それぞれ5 000行と200列)。私はすでにpartition_onとrow_group_offsetsを試しましたが、うまくいきません。 マイコード: import pan