1
現在、Python 3を使用しており、HDFSからピクルファイルをロードしたいと考えています。HDFSのファイルを解凍する
from pywebhdfs.webhdfs import PyWebHdfsClient
import pickle
hdfs = PyWebHdfsClient(host='...', user_name='...')
pickled_model = hdfs.read_file(pickle_path)
model = pickle.load(pickled_model)
TypeError: file must have 'read' and 'readline' attributes
ピクルスローディングステージでタイプエラーが発生します。 pydoop
を使用してファイルを開くオプションを見つけて、それをアンピクルしました。しかし残念ながら、私はPython 2.7を使用することはできません。同様のオプションはありますか?
pickle.loadは実際のpythonファイルハンドラを必要とします。 hdfs.read_fileがどのような型を返すのか分かりませんが、pickle.loads(bytes)というメソッドがあります。 –
@BluBb_mADeパーフェクト。私はそれを過度に複雑にしています。 – Justin