tiny_reads = [
Sequence('CGTGCAA'),
Sequence('TGCAATG'),
Sequence('ATGGCGT'),
Sequence('GGCGTGC'),
Sequence('CAATGGC'),]
dictionary = {}
def kmers(reads, k):
for line in tiny_reads:
for kmer in line.iter_kmers(k, overlap=3):
dictionary[str(kmer)] = 1
print(dictionary)
if str(kmer) not in dictionary:
dictionary[str(kmer)] = 1
else:
dictionary[str(kmer)] += 1
#print(dict)
kmers(tiny_reads, 3)
print(dictionary)
私のコードは上記のシーケンスを繰り返し、iter_kmer()を使用してシーケンスをサイズ3の小さな読み取り( 'CGT')に分割します。私はこれらすべての小さな読み込みを持つ辞書を作成し、それらがシーケンス内にどれくらいあるかのカウントを作成したいと思います。結果は、私は取得していないと私はなぜか分からない。辞書のpythonで鍵が見つかった場合の更新値
期待される結果:
kmers(tiny_reads、3) { 'AAT':2 'ATG':3、... 'TGG':2}
マイ結果: {[ CAG ':2、' GCG ':2、' GCG ':2、' ATG ':2、' TGC ':2、' CGT ':2、' AAT ':2、' GGC ' :2、 'TGG':2}
'ATG'が3回繰り返されるため、結果が正しくありません。あなたは私をイライラさせてくれますか?
これは大変ありがとうございました。 – Mufassa