私は25GBのテキストファイルを持っています。私はそれをtar.gzに圧縮し、450 MBになりました。今、私はPythonからそのファイルを読み込み、テキストデータを処理したいと思います。これは私がquestionを参照しています。私の場合はコードが機能しません。次のようにコードは次のとおりです。Pythonで.tar.gzファイルを読む
import tarfile
import numpy as np
tar = tarfile.open("filename.tar.gz", "r:gz")
for member in tar.getmembers():
f=tar.extractfile(member)
content = f.read()
Data = np.loadtxt(content)
次のようにエラーがある:
Traceback (most recent call last):
File "dataExtPlot.py", line 21, in <module>
content = f.read()
AttributeError: 'NoneType' object has no attribute 'read'
また、このタスクを実行する他の方法はありますか?
http://stackoverflow.com/q/33113600/ような何か1240268 –
*メンバーが上記のいずれでもない場合、Noneが返されます。*、メンバーはファイルまたはリンクではありません。 –