解決するには問題がありますが、自分ではできません。別のファイルから1つのパターンを取得している間に2つのパターン間の行を印刷する
ファイル1は、IDのを含有し、以下のようになります。私はIDと次の行を含む見出しを抽出したいファイル1からIDの付
>AIM49244.1 polyprotein [Aedes flavivirus]
(several lines of text only Alphabetic)
>NZ_03930.3 polyprotein [please help]
(several lines of text only Alphabetic)
>NP_722551.1 polyprotein [Alkhumra hemorrhagic fever virus]
(several lines of text only Alphabetic)
>NP_123456.7 polyprotein [Foo bar Foo bar]
several lines of text
and so on
:のようにファイル2が見え
>AIM49244.1
>NP_722551.1
>YP_002790883.1
>AGS41451.1
>AIM49245.1
>BAM74427.1
>CCC55433.1
次のIDが始まるまで、ファイル2のテキストを削除します。私は解決策を持っているが、ファイル2(>で始まる)説明ラインが一つだけ行が続いている場合にのみ動作し
>AIM49244.1 polyprotein [Aedes flavivirus]
(several lines of text only Alphabetic)
>NP_722551.1 polyprotein [Alkhumra hemorrhagic fever virus]
(several lines of text only Alphabetic)
:
例は、出力ファイルの結果。
awk 'FNR==NR{A[$1]=$1; next}$1 in A{print $0, getline; print $0}' File_1 File_2
しかし、私は新しい問題にそれを熟達できません。私はそれが範囲パターンで動作するようにしようとしましたが、正しく動作しません。だからあなたが私を助けることができればとてもいいです:)
これは、FASTAファイルのように見えます。 – Cyrus