ちょっと皮肉ですが、BufferedReaderを使用して2GBの.csvファイルを1行ずつ読み込んだとき、約4.5秒かかりました。私は約230MBになったgzipでファイルを圧縮しました。私はBufferedReaderでラップされたGZIPInputStreamを使って.gzファイルを読みました。それは約8.5秒かかりました。.csvファイルを.gzと同じファイルを読み込むよりも速く読み取る
私は、InputStreamインターフェースがReadersとは違ってデータのバイトを読み込むことを知っていますが、200MBのファイルがメモリにロードされるほうが速いと判断したとします。 .gzを使用してパフォーマンスを向上させることは可能ですか?ありがとう。
はい、それは私の疑いです。私の質問は、圧縮されたファイルを読んで何らかの形でパフォーマンスが向上するかどうかです。私はバッファサイズで微調整しようとしましたが、それは助けにはなりませんでした。私は、圧縮がIOの集中的なタスクであると想定しているため、CPUのタスク時間を邪魔することはありません。私が間違っていると思うなら、Plzは私を修正します。 –
圧縮歪みCPU more。あなたは基本的にディスク上のスペースを交換してCPU使用量を増やしています –