たとえば、文字列 'ATGAGGGATAGAGGGTTGGGAGAGATGGATAGGGGATAGATTG'がある場合 私はATGとTTGの間で部分文字列を取得する必要があります。Pythonの文字列から複数の部分文字列を見つける方法
私はそれを行うにはとにかく考え出すことはできません、PLZは私を介してそれを手伝って!
たとえば、文字列 'ATGAGGGATAGAGGGTTGGGAGAGATGGATAGGGGATAGATTG'がある場合 私はATGとTTGの間で部分文字列を取得する必要があります。Pythonの文字列から複数の部分文字列を見つける方法
私はそれを行うにはとにかく考え出すことはできません、PLZは私を介してそれを手伝って!
正規表現を使用すると簡単にそこにアクセスできます。例えば
:
import re
a = 'ATGAGGGATAGAGGGTTGGGAGAGATGGATAGGGGATAGATTG'
print re.findall("ATG(.*?)TTG", a)
出力:
['AGGGATAGAGGG', 'GATAGGGGATAGA']
ありがとうございました –
これは重複する部分文字列を見つけることができないようです。詳細はhttp://stackoverflow.com/questions/8390913/how-to-select-only-certain-substrings – HongboZhu
ここで得られる出力の種類は{リストまたは文字列またはシーケンス} –
ことが可能です(完全に、または部分的に)重複する 'ATG ... TTG'シーケンスのため? – ekhumoro
「TTG」の逆の検索はどうですか? –