2012-03-12 16 views
0

私がしたいのは、GenBankレコードの推定されないすべての配列をゲノムファイルに小文字で入れることです。GenBankレコードの順序を変更する方法は?

これまでのところ、私はgbkのタンパク質の開始位置と終了位置を取得することができました。 は、そこから私は次のようにします。

start = feature.location.nofuzzy_start 
end = feature.location.nofuzzy_end 
gb_record.seq[start:end] 

を今私は、ゲノム中の配列の開始と終了位置を持っています。しかし、どのようにゲノムファイルを変更するのですか? gb_record.seq[start:end].lower()または類似のものがトリックをしなかった。

gb_record.seq = gb_record.seq[start:end].lowerを割り当てると、ゲノムファイルを置き換えると明らかに間違っています。何か案は?

+1

ソリューション: は解決策ではなく、実際にbiopythonの解決策を見つけました。 まず、genome.seqファイルをゲノム文字列ファイルに置きます。 ゲノム= STR(gb_record.seq) そしてgb_record.featers 開始= feature.location.nofuzzy_start 端を通過しながら= 上側=ゲノムをfeature.location.nofuzzy_end [スタート:終了] 低級=ゲノム[開始:終了] .lower() genome = genome.replace(upper、lower).......フォーマットするのは申し訳ありませんが、 – Jasper

答えて

1

Bio.Seq.Seqオブジェクトには、探しているものを実行するlower()メソッドがあります。あなたのコードをオフに作業する

、あなたが取得したい:

seq_lower = gb_record.seq.lower() 

あなたはその後、ファイルに小文字のシーケンスを書き出すためにSeqIOモジュールを使用することができるはずです。

from Bio import SeqIO 

with open("example.fasta", 'w') as handle: 
    SeqIO.write(lower_records, handle, 'fasta') 
関連する問題