、それは完全にファイルを解凍せずにパイソンを使用したGZ-圧縮されたテキストファイルから行を読みやすいですか?私は200mbのaroudのtext.gzファイルを持っています。私はそれを抽出すると、7.4ギガバイトになります。これは私が読まなければならない唯一のファイルではありません。プロセス全体については、10個のファイルを読み込む必要があります。これは逐次的な仕事になりますが、私は情報全体を超越することなくそれを行うことは賢明なことだと思います。私はそれが可能であることを知らない。どのようにそれはPythonを使用して行うことができますか?テキストファイルを1行ずつ読む必要があります。のpython:圧縮されたテキストファイル
32
から行を読み込む
A
答えて
12
あなたがgzip.GzipFileを使用してみましたか?引数はopen
に似ています。
38
あなたはpythonで標準のgzipモジュールを使用することができます。
gzip.open('myfile.gz')
このファイルを他のファイルとして開き、その行を読み込むだけです。
ここに詳細情報:gzip.GzipFileを使用してPython gzip module
22
:
import gzip
with gzip.open('input.gz','r') as f:
for line in f:
print('got line', line)
注:のpython3のためにあなたがバイナリ読書に'r'
デフォルトとして、'rt'
にオープンするファイルを指定する必要があり、またはそれ以外の場合はline.decode(...)
を使用します。
注:gzip.open(filename, mode)
は、gzip.GzipFile(filename, mode)
の別名です。 私は前者を好みます。これは、非圧縮ファイルを開くために使用されるwith open(...) as f:
に似ています。
関連する問題
- 1. 単純なテキストファイルを圧縮するPython
- 2. 7zで圧縮されたテキストファイルの読み込み方法は?
- 3. 時間圧縮されたオーディオアーカイブの損失圧縮の戦略
- 4. 圧縮されたAPIレスポンス
- 5. OutOfMemoryError圧縮されたクラススペース
- 6. 圧縮された(圧縮された)フォルダが無効ですJava
- 7. Python ZipFileがテキストファイルの一部を圧縮しています
- 8. 圧縮されたYouTubeのデフォルト画像
- 9. 圧縮されたファイルのGrepデータUnix
- 10. 圧縮されたOpusフレームのサイズ(バイト)
- 11. Pythonでテキストファイルを圧縮および解凍する
- 12. (JavaScriptのは、Firefox)WebExtensionsにLZ4圧縮されたテキストファイル(mozlz4を)読ん
- 13. テキストファイルを圧縮する方法
- 14. 圧縮されたアバター画像がPythonで「回転」する
- 15. Pythonで圧縮されたファイルから1行ずつ読む
- 16. 圧縮されたSpring MVC応答をjqueryで圧縮解除しました
- 17. C - 圧縮解除されたHTTPレスポンス
- 18. Subversionで圧縮されたxmlファイル
- 19. 圧縮されたJSONファイルを読む
- 20. 無効なエントリ圧縮されたサイズ
- 21. .zstdで圧縮されたデータファイルをインポート
- 22. HTTPリクエストを圧縮してメモリに圧縮されたバッファをロードせずに圧縮する方法
- 23. webpack圧縮が圧縮されていません
- 24. 圧縮された情報がlz4を使用して圧縮されていて、圧縮された情報が期待通りではありません。
- 25. 最終日に修正されたファイルを圧縮/圧縮する
- 26. 圧縮されたサウンドファイルを非圧縮ファイルに変換する方法
- 27. mongodb python圧縮サーバー接続
- 28. pythonで圧縮された(任意の)dbmファイルを扱うためのレシピ
- 29. 圧縮または
- 30. データ圧縮と画像圧縮の差
out of curiosityこれはファイル全体をメモリにロードしますか?それとも、必要に応じて線を読み込むのに十分なスマートなのでしょうか? –
@Sachin_rukこれは、ファイルを開く直前のファイルをロードしません。ファイルから実際にデータを読み込むには、一度に1行ずつ読み込むために '' 'f.readline()' 'を実行する必要があります。または '' f.readlines(N) ''ここで、 '' N''は読みたい行の数です。 – Tom