1
現在、いくつかのDNA配列を含むFASTAファイルがあります。一部の行末をタブ区切り文字に置き換える
"> \ w {4} \ d {6}" DNA配列ファイル - 300文字以上のランダムな大文字アルファベット文字の行。
私は各シーケンスタブを区切り、各記述子とシーケンスがタブで区切られた単一の行になるようにしようとしています。以下は私が試したことです:
from __future__ import print_function
import re
import sys
Fasta_seq = open(sys.argv[1])
for a_line in Fasta_seq:
if re.search('^>.+', a_line):
re.sub('.+\n', '.+\t', a_line)
print(a_line, end='')
else:
re.sub('.+', '.+', a_line)
print(a_line, end='\n')
しかし、このコードは私の記述子の最後に終わる行を削除していないようです。まったく同じ出力を私に返します。
誰も私が見落としていることのアイデアはありますか?
をインターリーブ:'、 ''前にインデント 'a_line = a_line.strip()を追加if行。また、 'else'節の' print'の 'end = '\ n'''を削除してください。 – martineau
あなたはWindowsにいますか? –
はい、私はWindows 7を実行しています。 – martineau