0
1つのチャンクのような4つのラインで構成されているファイル内の文字列の重複チャンクを削除したいのsedポイント
終点
電圧数
終了点が重複している場合は、同じ行(?)の重複したチャンクを削除したいと思います。
たとえば、最初と2番目のチャンクの終点は最初の行で同じで、最初のチャンクだけを保持したいとします。したがって、第2のチャンクは第1の行で除去される。
第2行目では、第1チャンクと第3チャンクの終了点は同じで、最初のチャンクを保持します。
INPUT.TXT:
path_sparc_ffu_dp_out_1885 path_sparc_ffu_dp_out_2759 path_sparc_ffu_dp_out_3115
R_1545/Q R_1541/Q R_1545/Q
dp_ctl_synd_out_low[6] dp_ctl_synd_out_low[6] dp_ctl_synd_out_low[2]
0.926208 0.910592 0.905082
path_sparc_ffu_dp_out_699 path_sparc_ffu_dp_out_712 path_sparc_ffu_dp_out_819
R_1053/Q R_1053/Q R_1053/Q
dp_ctl_synd_out_low[2] dp_ctl_synd_out_low[6] dp_ctl_synd_out_low[2]
0.945436 0.945436 0.9435
のoutput.txt:
path_sparc_ffu_dp_out_1885 path_sparc_ffu_dp_out_3115
R_1545/Q R_1545/Q
dp_ctl_synd_out_low[6] dp_ctl_synd_out_low[2]
0.926208 0.905082
path_sparc_ffu_dp_out_699 path_sparc_ffu_dp_out_712
R_1053/Q R_1053/Q
dp_ctl_synd_out_low[2] dp_ctl_synd_out_low[6]
0.945436 0.945436
私はAWK/SEDこの作業を行うことができると思います。どんな助けもありがとうございます。
ベスト、
Jaeyoung
uniq文字列のみを表示するユニークを試みましたが、uniqチャンクを表示する方法はわかりませんでした。awkを試しましたが、私はawkの新機能です。だからお願い。任意の提案は高く評価されます。 –
私はこれがよく知られていることを知っていた。 IMHOでは、このアプローチではなく、以前のQ(http://stackoverflow.com/questions/37141953/relocation-strings-using-awk-sed-from-a-index-file)を修正しようとします。この新しいレイアウトは、あなたの問題を理解することをより困難にします。がんばろう。 – shellter
こんにちは@ jaeyoung-park、あなたのすべてのチャンクには重複が含まれているか、またはそれらの一部だけが含まれていますか? –