私は数日からのPythonの問題に直面しています。私は基本的なプログラミングスキルのないバイオインフォマティクスです。私は処理しなければならない巨大なテキストファイル(約25GB)を扱っています。巨大なテキストファイルの行を4のグループで読む
私はtxtファイルを1行につき4行ずつ読み込む必要があります。つまり、最初の4行を読み込んで処理してから、2行目の4行を読み込む必要があります。そうです。
明らかに私はメモリを過負荷にするので、私はreadlines()演算子を使うことができません。文字列認識のためには4行のそれぞれを使わなければなりません。
私は範囲オペレータとののサイクルを使用して考えた:残念ながら、これはpossibile "読み" モードであるため、ファイルではありません
openfile = open(path, 'r')
for elem in range(0, len(openfile), 4):
line1 = readline()
line2 = readline()
line3 = readline()
line4 = readline()
(process lines...)
リストや辞書のように反復処理することはできません。
誰でもこのサイクルを正しく行うことができますか?事前
は読み込みのために開かれやすい行指向的に巡回できない - を参照してください'file.next()'のセクションを参照してください:http://docs.python.org/library/stdtypes.html?highlight=file.next#file.next – martineau