私の質問は非常にシンプルですが、適切な答えはどこにも見つかりませんでした。 。の.txtファイルを読み込み、重複行があるかどう、1を保持していない、それらのすべてを削除する方法たとえば、.TXTに次のものが含まれます。PHPを使ってファイル内の重複した行を削除するにはどうすればいいですか?(オリジナルのものを含む)
1234
1233
1232
1234
出力は次のようになります。
1233
1232
コードは複製された行をすべて削除する必要があるため、すべてのWebを検索しましたが、常にrem複製された行は削除されますが、this、this、またはthatのように、それらの1つを保持します。
これを実行する唯一の方法は、x行を読み込んで、.txt全体をチェックして、同じ結果を見つけたら、x行も削除して削除することです。そうでない場合は、次の行に変更します。しかし、私がチェックしている.txtファイルには50億の行(〜900Mb)があります。このような仕事をするためにどれくらいのメモリが必要かわからないので、ここで助けてください。
をあなたは私の解決策をテストすることができる場合、私は興味がある...特別にそのメモリフットプリントについて:) –
出力ファイルの行の順序は重要ですか? – Mike
努力していただきありがとうございます、あなたのコードは小さなファイルで動作することができますが、私はそのために十分なメモリがないため、50百万のエントリでコードをテストできません... –