1
シーケンシング遺伝子の名前を示す行とecoli.ffn
ファイルあり:上記のようにエキス各配列決定データの個々のファイルとして
$head ecoli.ffn
>ecoli16:g027092:GCF_000460315:gi|545267691|ref|NZ_KE701669.1|:551259-572036
ATGAGCCTGATTATTGATGTTATTTCGCGT
AAAACATCCGTCAAACAAACGCTGATTAAT
>ecoli16:g000011:55989:gi|218693476|ref|NC_011748.1|:1128430-1131042
GTGTACGCTATGGCGGGTAATTTTGCCGAT
>ecoli16:g000012:55989:gi|218693476|ref|NC_011748.1|:1128430-1131042
GTGTACGCTATGGCGGGTAATTTTGCCGAT
CTGACAGCTGTTCTTACACTGGATTCAACC
CTGACAGCTGTTCTTACACTGGATTCAACC
は、遺伝子名は、第1及び第2のコロンの間である。
g027092
g000011
g000012
私は、g027092.txt
,g000011.txt
、g000012.txt
の3つのファイルを生成するために、それぞれのシーケンシングデータを含むようにecoli.ffn
を使用します。例えば
、g027092.txt
意志がヘッダせずに生のデータが、が含まれています
$cat g027092.txt
ATGAGCCTGATTATTGATGTTATTTCGCGT
AAAACATCCGTCAAACAAACGCTGATTAAT
それを作るためにどのように?
こんにちは@karakfa、少し説明できますか? –
されています。 awkはとても強力で正規表現です。 – Ming
乾杯!@ karafka !!! –