「re」パッケージを使用してPythonの次の問題を解決するために、魔法の構文を理解しようと1時間を費やしました。私はしばらくの間、それを中心にハッキングしてきたが、課題を設定したいと思います:キャプチャカッコと貪欲でないマッチング制約を持つ正規表現
次の文字列は、我々のテストを表す:
*Structure song <!-- See Project:Project_Songs -->
*Structure song |
*Structure song title |
目的は「歌」、「歌」を抽出することであり、これらから単一の正規表現を使用して '曲名'を作成します。
私の試み:
r'\*Structure ([^\|]*)(?:<)?'
私は私がこれまで試した様々な組み合わせであなたを退屈しません。私の回避策は、アンパサンド '&'をキャプチャ括弧の除外セットに追加します。しかし、私はむしろ、抽出された文字列に '&'を含めることができないと仮定しません。
代わりに、あなたの試合の最後の境界とは何でしょうか? –
「タイトル」パターンと省略したいその他の点の間には、どんな違いがありますか? –
複雑な正規表現を書くのではなく、単純に[unescape](https://docs.python.org/3/library/html.html#html.unescape)にしてください。 – jonrsharpe