参照テキストファイルの情報に基づいてFASTAヘッダーを変更したいとします。だから私は2つのファイルを持っていると言う:(タブ区切り参照)2つのファイル(fastaとtxt)を比較します。一致する場合は、fastaヘッダーにtxtファイルの値を付加します。
FILE1.TXT
chr1:100-1000(+) ORF1_ORF2_
chr2:30-400(-) ORF2_
chr3:50-4500(+)
chr4:60-800(-) ORF1_
file2.fasta
>chr1:100-1000(+)
TTTTGAGAGGACTTCTCTGAGAGCTATGCTAGTCATCGAGGGGAAA
>chr2:30-400(-)
GGGGGGAGAGAGATCTCTGAGCTAGTCATCGTAGCTAGTCATGGGG
>chr3:50-4500(+)
ATGCGCGAGCGAGCGCGACGATCATCGTAGCTACAAAAAAAAAAAG
>chr4:60-800(-)
AGTCTAGCTATCGTAGCTGATCGTAGCTAGCTGATCGTAGCTAGTC
私が識別するためにFILE1.TXTから$ 1使いたいですfile2.fastaの対応するヘッダー。一致するものがあれば、現在のヘッダーにfile1.txtから$ 2を付加します。だから、所望の出力は次のようになります。
>ORF1_ORF2_chr1:100-1000(+)
TTTTGAGAGGACTTCTCTGAGAGCTATGCTAGTCATCGAGGGGAAA
>ORF2_chr2:30-400(-)
GGGGGGAGAGAGATCTCTGAGCTAGTCATCGTAGCTAGTCATGGGG
>chr3:50-4500(+)
ATGCGCGAGCGAGCGCGACGATCATCGTAGCTACAAAAAAAAAAAG
>ORF1_chr4:60-800(-)
AGTCTAGCTATCGTAGCTGATCGTAGCTAGCTGATCGTAGCTAGTC
output.fasta
私は2つのファイルから列を比較するために、過去にはawkを使用しましたが、私はにテキストファイルを比較する方法についての困惑しますfastaファイル(カラムの代わりにヘッダとシーケンスがある)。どんな助けも素晴らしいだろう!
これはなぜpythonとbashタグを持っていますか?無関係のタグを削除してください。 –
ああああ。私はsedタグについて言及していませんでしたが、**あなたはsed **を使用していません。脳と一般的な礼儀を適用してください。 –
私はawk解のみに質問を限定するつもりはありませんでした(同様の質問はsedなどで解決されているように見えます)。 – gizmo