2016-03-19 28 views
-2

.txtというファイルがあり、実際には長いRNAmというファイルがあります。私はシーケンスの正確な長さを知らない。私がする必要がどのようなPythonで文字列の一部を抽出します

は、それが「AUG」で始まり、「UAA」「UAG」または「UGA」で終わるという意味、有効なシーケンスの一部を抽出しています。シーケンスが長すぎるため、文字のインデックスや有効なシーケンスの位置はわかりません。

新しいシーケンスを別の変数に保存する必要があります。

+3

は、スタックオーバーフローへようこそ!どのコードを試しましたか?有効なものとそうでないものの例を挙げ、 'txt'ファイルの内容を投稿してください。 –

+1

txtファイルの短い抜粋を追加する必要があります。 – DonkeyKong

答えて

0

基本的に、あなたはあなたのための全体をコーディングせずに、何をする必要があるか、次のとおりです。

例文字列:

rnaSequence = 'ACGUAFBHUAUAUAGAAAAUGGAGAGAGAAAAUUUGGGGGGGAAAAAAUAAAAAGGGUAUAUAGAUGAGAGAGA' 

あなたは「8月」のインデックスを見つけることになるでしょうそして、「UAA」、「UAG」のインデックス、または「UGA」..サムシング

このような
rnaStart = rnaSequence.index(begin) 

は、その後、あなたは新しいVARに文字列のスライスを設定する必要があります返し上記の私の文字列では、iable

rnaSubstring = rnaSequence[rnaStart:rnaEnd+3] 

AUGGAGAGAGAAAAUUUGGGGGGGAAAAAAUAA 
関連する問題