アーカイブ内のファイルを読み込むためにzipfileモジュールを使用しようとしています。非圧縮ファイルは〜3GB、圧縮ファイルは200MBです。圧縮されたファイルを1行ずつ処理するので、私はそれらをメモリに入れたくありません。これまでのところ私は、次のコードを使用して、メモリの使いすぎに気づいた:Pythonで行ごとに大きなzip形式のテキストファイルを読む
import zipfile
f = open(...)
z = zipfile.ZipFile(f)
for line in zipfile.open(...).readlines()
print line
私はSharpZipLibを使用してC#でそれをやった:
var fStream = File.OpenRead("...");
var unzipper = new ICSharpCode.SharpZipLib.Zip.ZipFile(fStream);
var dataStream = unzipper.GetInputStream(0);
データストリームは圧縮されていません。私はPythonでそれを行う方法を見つけることができないようです。ヘルプは高く評価されます。
これ以上は言えませんでした –