私はPythonでプログラミングするのがとても新しいです。私はいくつかの植物種のタンパク質配列を含むファーストファイルを持っています。BiopythonでIDSに基づくFASTAファイルをフィルタリングする
各配列に含まれるアミノ酸の数に基づいてそれらをフィルタリングしたいと思います。基準は20アミノ酸を超える配列である。
biopython cookbookのリソースで20を超えるアミノ酸配列を得ることができます。しかし、ファイルに書き込もうとすると、これは私にこのErrorを与えます。私はこのエラーを解決することができません。また、出力ファイルに各シーケンスのIDを持たせたいと思います。私を助けてください!
コード:
import Bio
from Bio import SeqIO
for s_record in SeqIO.parse('arabidopsis_thaliana_proteome.ath.tfa','fasta'):
name = s_record.id
seq = s_record.seq
seqLen = len(s_record)
if seqLen >20:
desired_proteins=seq
output_file=SeqIO.write(desired_proteins, "filtered.fasta","fasta")
output_file
入力ファイル:Arabidopsis Thaliana
>AT5G16970
MTATNKQVILKDYVSGFPTESDFDFTTTTVELRVPEGTNSVLVKNLYLSCDPYMRIRMGKPDPSTAALAQAYTPGQPIQGYGVSRIIESGHPDYKKGDLLWGIVAWEEYSVITPMTHAHFKIQHTDVPLSYYTGLLGMPGMTAYAGFYEVCSPKEGETVYVSAASGAVGQLVGQLAKMMGCYVVGSAGSKEKVDLLKTKFGFDDAFNYKEESDLTAALKRCFPNGIDIYFENVGGKMLDAVLVNMNMHGRIAVCGMISQYNLENQEGVHNLSNIIYKRIRIQGFVVSDFYDKYSKFLEFVLPHIREGKITYVEDVADGLEKAPEALVGLFHGKNVGKQVVVVARE*
>AT4G32100
MATNACKFLCLVLLFAFVTQGYGDDSYSLESLSVIQSKTGNMVENKPEWEVKVLNSSPCYFTHTTLSCVRFKSVTPIDSKVLSKSGDTCLLGNGDSIHDISFKYVWDTSFDLKVVDGYIACS*
は、事前にありがとう:)
エラーメッセージは何ですか? – Terry
AttributeError: 'str'オブジェクトに 'id'属性がありません – adeelulrahman
正確なエラーメッセージを出力し、エラーの例を入力してください。 – Vince