可能性の重複:
Python: How to read huge text file into memory行ベースのファイル読み込み用のPythonライブラリはありますか?
線によって大きなテキストファイル(1G +)ラインを処理するために、任意の行数によってランダムアクセスがファイル全体をロードせず、最も重要なことは、望まれていますコンテンツをRAMに保存します。それを行うためのPythonライブラリはありますか?
大規模なログファイルを分析する場合は、読み取り専用で十分です。
このような標準ライブラリがない場合は、別の方法を模索する必要があります。サブストリングのN番目の行を大きな文字列のようなオブジェクトから返すことができる関数/クラスのセットを見つけて、 mmap(はい、私はメモリマップされたファイルオブジェクトを意味することができます)ファイルをそのオブジェクトにし、ラインベースの処理を行います。
ありがとうございます。
PS:ログファイルの可変長はほぼ確実です。
を行うことができますが、同じ長さのすべての行はありますか? –
ファイルを前処理してソートのインデックスを作成できますか? – anijhaw