基本的には、4gigのテキストファイルを1行ごとに処理する必要があります。Pythonでの大きなテキストファイルの扱い
.readline()を使用するか、またはin line in fを使用するとメモリには掛かりますが、IOには時間がかかります。利回りのようなものを使いたいと思っていますが、それは(私が思う)線を切り詰めるでしょう。
POSSIBLE ANSWER:
file.readlines([sizehint])¶
Read until EOF using readline() and return a list containing the lines
のでお読みください。オプションのサイズヒント 引数が存在する場合は、 のEOFまでの読み取りではなく、 の合計サイズのヒントバイト (おそらく の内部バッファサイズに切り上げた後)が読み込まれます。 ファイル形式の を実装するオブジェクトは、実装できない場合は サイズヒントを無視するか、効率的に実装できない場合があります。
これを行うことができませんでしたか?
あなたはログファイルを解析していますか?そうしないでください。それをより良くするライブラリがあります。 –
ナナナナナナナナナナナイテレータ! (バットマンテーマbtw) –
大きなセットアップファイルと行を追加しています。私はreadlines()を動作させようとしていますが、それは困難であることが証明されており、リクエストされた次のチャンクに移動するようには見えません。 – jdborg