2017-09-07 6 views
0

誰でもこのエラーを解決しましたか?メッセージ:compressions['SNAPPY'] = snappy.compress AttributeError: module 'snappy' has no attribute 'compress' 寄木細工をPythonで読むと? Btw、そこには全司令官を読む方法がありますか?次のようにhttps://pypi.python.org/pypi/parquetpython 3 mac:snappy.compress AttributeError:モジュール 'snappy'は属性 'compress'を持っていません

コードごとに設置

snappythriftと私はMac上 condaを通じて python 3を使用しています

import parquet 
import json 
import fastparquet 

with open(data_in_path + "file.parquet/part-01snappy.parquet", 'rb') as fo: 
for row in parquet.DictReader(fo, columns=['id', 'title']): 
    print(json.dumps(row)) 

または

df2 = fastparquet.ParquetFile(path).to_pandas() 

答えて

0

snappy解決策を見つけることができませんでした、私はsparkのデータをで読んでいますと各後gzip Pythonで無問題でそれを書き戻しが発見されています

df.coalesce(1).write.option("overwrite","true").option("compression","gzip").parquet(dfWithGzip.parquet") 
0

私は同じ問題がありました。

私は間違ったpythonパッケージをインストールしたのです。あなたがpython-snappyの代わりに、私の場合はsnappy

を(のOS X)をインストールする必要があり、それは簡単で、2段階のプロセスだった:

brew install snappy 
pip install python-snappy 
関連する問題