2016-11-18 4 views
-1

私はPythonコーディングには新しく、品質文字列をPHREDスケールの品質スコアのリストに変換する機能を作るのに問題があります。助けを求めてここで品質文字列をPhredスコアのリストに変換する機能の作成

FASTQが読み込まれます。

@SEQ_ID 
AAGCGTCTGATCGGCAGAGGATACACATGCCGCACGTCGAGTATCTCGGC 
+ 
=3:AAF>FGD1FCGGGGGFBGGGGCGGG1FE>>>E<:>/<9:[email protected] 

をこれは、関数の定義である:

def quality_to_list(quality_string): 

答えて

0

BioPythonは良い例とPHREDスコア上documentationのカップルを持っています。

from Bio import SeqIO 
with open('tmp.fastq', 'w') as f: 
    f.write("""@SEQ_ID 
AAGCGTCTGATCGGCAGAGGATACACATGCCGCACGTCGAGTATCTCGGC 
+ 
=3:AAF>FGD1FCGGGGGFBGGGGCGGG1FE>>>E<:>/<9:[email protected]""") 

for record in SeqIO.parse("tmp.fastq", "fastq"): 
     print("ID: {0}\nPhred scores: {1}".format(record.id, record.letter_annotations['phred_quality'])) 

出力:

ID: SEQ_ID 
Phred scores: [28, 18, 25, 32, ..., 34, 35, 38, 37, 38, 31, 38, 38] 
関連する問題