約200,000列と約5000行の大きなファイルがあります。 ファイルの短い例を示します。列1と5が重複しています。ファイルbashツールから列を削除する
Abf Bgj Csd Daa Abf Efg ...
0 1 2 1 0 1.1
2 0.1 1.2 0.3 2 1
...
これは私が必要とする結果の例です。元のファイルの列5が削除されました。
Abf Bgj Csd Daa Efg ...
0 1 2 1 1.1
2 0.1 1.2 0.3 1
...
いくつかの列は複数回複製されます。 bashツールを使用してデータから重複を削除する必要があります(最初のインスタンスを維持する)。 注文を保存する必要があるため、データを並べ替えることができません。
あなたの質問をフォーマットし、希望の出力を表示 – RomanPerekhrest
各列の値を比較する必要がありますか、列見出しだけで十分でしょうか?例えば、canファイルには、同じ 'Abf'ヘッダを持つ異なるカラムが含まれていますか?つまり、1)ファイルをトラバースし、同じヘッダーを持つすべての列を削除し、2)ファイルをトラバースし、同じヘッダーと値を持つすべての同じ列を削除します。 – MiniMax
私は列ヘッダーを比較するだけです。 – gwarr