私は、ファーストパラレルを使用して、パンダのデータフレームをパーケットファイルに変換しています。 pysparkを使っていた以前のアプローチよりもはるかに高速です。fastparquet:rleのエンコードを無効にする方法
私は私が解決するために管理いくつかの問題を持っていた、すなわち
sqlCtx.read.parquet('/tmp/parquet/test.parquet')
火花を使用して、これらの寄木細工のファイルを読みたいです。私が今問題になっているのは、RLEエンコーディングです。私はpysparkと寄木細工のファイルを読み込むしようとすると、私は次のJavaの例外を取得しています:
Unsupported encoding: RLE
はfastparquet write
メソッドを使用するときにRLEを無効にする方法はありますか?