つのジョブがサーバー上で実行される値の交換後にレコード数をカウントし、それは以下のようにファイルを作成します。現在、重複が
1000727888004
522101 John Smith
522101 John Smith
522188 Shelly King
522188 Shelly King
1000727888002
522990 John Doe
522990 John Doe
9000006000000
、我々は、コードを修正する過程にあるが、それは月がかかります。その間に、以下のような重複レコードを削除するコマンドを使用しています。私は上記のコマンドを実行した後
perl -ne 'print unless $dup{$_}++;' old_file.txt > new_file.txt
、それが重複したエントリを削除しますが、数が同じ以下のように残っている:1で始まる行に対する
1000727888004
522101 John Smith
522188 Shelly King
1000727888002
522990 John Doe
9000006000000
最後の数は総数である(その4はされている必要があります1行目は2、4行目は1でなければならず、6は9で始まる最後の行では3であったはずです)。以下のようになります。
1000727888002
522101 John Smith
522188 Shelly King
1000727888001
522990 John Doe
9000003000000
これを修正するロジックはありませんでした。私はここで助けが必要です。別のコマンドを実行したり、perlコマンドで何かを追加してカウントを修正したりすることはできますか?はい、メモ帳でファイルを開くことができます+ +と手動で番号を修正するが、私はそれを自動化しようとしています。
ありがとうございます!
最後のレコードは、9で始まることは何ですか? –
は、合計カウントを持つファイルのトレーラです。最初の9が常に存在し、次の6つの数字がカウントです.1つの数字の場合は、5つのゼロが左に埋められます。最後の6つの数字は常に0です – Amir