RegExを使用して、さまざまなバリエーションのURLの特定の部分を抽出しようとしています。時々 "MIP" の部分が存在しないことをRegExを使用してURLの一部を抽出する
http://www.blackpages.com/cityName-StateName/mip/part-I-want-to-extract/randomCharacters
とURLは次のようになります:ここで は、一般的な形式です
re.compile("blackpages\.com/.*")
:
http://www.blackpages.com/cityName-StateName/part-I-want-to-extract/randomCharacters
私は、次のREを書き始め
.*
は任意の文字に一致します。次に、「/」に遭遇したときに停止し、次の「/」が発生する前にすべてを抽出します。これは、私が抽出したい部分を私に与えるだろう。あなたが否定文字クラスを使用する必要が
ラケッシュ、任意のより多くの懸念?私の答えの下に線を落としてください。 –