Pythonで/ <from <と区別する

この形式のタグを見つけるパターンは、<。*：。*>です。ネストされたタグから、子タグのみを取ります。ここで角括弧（<と>）を '/ <'と '/>'から区別する必要があります。同じパターンでこれを実行できる方法はありますか？Pythonで/ <from <と区別する

例：入力文字列

<testing this> any text </<this is not a tag>any text<this will fail/>>

出力：

['<testing this>','</<this is not a tag>','<this will fail/>>']

任意の提案は私に知らせてください。

2016-07-06 Sohn

それはあなたが正規表現で[X] HTMLを解析しようとしている不快なように見えます。 [しないでください。]（http://stackoverflow.com/a/1732454/3001761）パーサーを使用する、それは彼らのためだ！ – jonrsharpe

RegExを使用する場合は、LookBehindを使用する必要があります。 – CodenameLambda

'/ <'はどういう意味ですか？あなたは ' Aprillion

使用このパターン：

(?<!/)<.*?(?<!/)>

(?<!/)は、実際に文字を消費することなく、各<または>の左側に直接スラッシュがない保証否定後読みです。

2016-07-06 09:30:03

答えて