http://www.test.com
のようなURLを正規表現の中に入れて、電子メールの内容であるbody
を取得しました。Python - Regexが<>内のものを無視する
しかし、この形式でのURLがあることができます:<http://www.test.com>
私はあなたが正規表現でこれを行う上で主張する場合、これらのシンボル内<>
url = re.search('http[s]?://(?:[a-zA-Z]|[0-9]|[[email protected]&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', body)
正規表現を使用しないほうが簡単かもしれません。 – khelwood
あなたの選択肢は何ですか?文字列を正規表現に渡す前に<>内のすべてを取り除くことを考えていたのでしょうか? – dperrie
これは非常に簡単な変更で行うことができます。 "regex lookarounds"を検索してください。または、正規表現のチュートリアルを一般的に行うだけです。あなたの正規表現は複雑で重複しており、気づいていないバグがほとんどあります(ヒント: '$ -_ @。&+]') –