2017-11-15 12 views
0

私は、各行に少なくとも2つの列で区切られたタブであるテキストファイルを持っています。最初の列はユニークなIDで、後の各列はfasta配列(DNA Sequence Identifier)の識別子です。私の質問は、この構造を2列の行列に再構成する方法です。テキストファイル個々の行に辞書のような行をフォーマットする

これは私がこのデータ形式から行ってみたいこと:このデータ形式に

1040713 91 
969805 47 
862949 502 485 
798097 671 593 
939058 575 
721526 400 523 76 610 

1040713 91 
969805 47 
862949 502 
862949 485 
798097 671 
798097 593 
939058 575 
721526 400 
721526 523 
721526 76 
721526 610 

私は「awkの-F '\ tを' を使用しようとしています{$ 3印刷します} '|新しい行の文字と最初の列のsedに渡します。しかし、私はパイプの後の最初の列にアクセスする方法が不明です。私の希望する書式を達成するための提案は非常に高く評価されます。

答えて

1

awkレスキュー!

awk '{for(i=2;i<=NF;i++) print $1 "\t" $i}' 
+0

これは完璧です。 AWKは私のヒーローです! –

関連する問題