0
これは、txtファイル(CDS-テキスト-ORIGINの繰り返し単位)の構造で一覧表示する追加、文字列として二つの単語間のテキストをキャプチャ:私は引き出すたいPythonの正規表現 - その後、
CDS 311..>428
/gene="PNR"
/codon_start=1
/product="photoreceptor-specific nuclear receptor"
/protein_id="AAD28302.1"
/db_xref="GI:4726077"
/translation="METRPTALMSSTVAAAAPAAGAASRKESPGRWGLGEDPT"
ORIGIN
文字列 として311 .. < 428からGEDPTにテキスト」私がこれまで持っている正規表現は次のとおりです。
compiler = re.compile(r"^\s+CDS\s+(.+)ORIGIN.+", re.DOTALL|re.MULTILINE)
私は、リストに各文字列を追加するためにループを使用します。
for line in file:
match = compiler.match(line)
if match:
list.append(str(match.group(1)))
しかし、私は空のリストを取得し続けています!なぜどんなアイデア?
助けていただければ幸いです。私はこれが初めてです!