これはウェブサイト上のコンテンツのサイズに関するものです。このlink checker toolはPython Regexをサポートしています。リンクチェッカーでは、1つのコンテンツディメンションに関する情報を取得したいと考えています。特殊文字のPythonを使用したRegex否定ルックアヘッド文字列
de_de
という文字列(オプション)以外はすべて一致させたいと思います。
https://www.example.com/int_en
https://www.example.com/int_de
https://www.example.com/de_de ##should not match or all others should match
https://www.example.com/be_de
https://www.example.com/fr_fr
https://www.example.com/gb_en
https://www.example.com/us_en
https://www.example.com/ch_de
https://www.example.com/ch_it
https://www.example.com/shop
私は、これらのアプローチわたってるしきどこかに立ち往生しています:
https:\/\/www.example.com\/\bde\_de
https:\/\/www.example.com\/[^de]{2,3}[^de]
https:\/\/www.example.com\/[a-z]{2,3}\_[^d][^e]
https:\/\/www.example.com\/([a-z]{2,3}\_)(?!^de$)
https:\/\/www.example.com\/[a-z]{2,3}\_
https:\/\/www.example.com\/(?!^de\_de$)
にはどうすれば特殊文字(アンダースコア)で文字列を一致させるために、負の先読みを使用できますか?
(?!^de_de$)
私はregexの新機能です、どんな助けや入力がよろしいですか?
すべての '/ de_は*' '/ de_de'だけ一致するかではないでしょうか? – Arman
'https:\/\/www.example.com \ /(?! de_de(?:\/| $))[a-z - ] +' –
@Arman de_deは一致しません。/int-de、/ de_en、/ ch_de、/ shop、... --no-follow-urlオプションに一致させたい。 –