PHPでは、robots.txtファイルに「User-agent」指示が連続しているかどうかをチェックしたいと思います。PHPでrobots.txtの連続した 'User-agent'指示文を検索
この正規表現では、preg_match('~User-agent:\h*(?:\R|$)~i', $string)
すべての 'User-agent:'行が見つかりましたが、連続する行を検出する方法が見つかりませんでした。
User-agent: # 'User-agent:'
\h* # horizontal whitespace (0 or more times)
(?: # group, but do not capture:
\R # '\R' (any Unicode newline sequence)
| # OR
$ # before an optional \n, and the end of the string
) # end of grouping
User-agent: 008
user-agent: Accoona
User-Agent: Googlebot
User-Agent: aipbot*
disallow:/
結果:真
User-Agent: Googlebot
Crawl-delay: 60
User-agent: aipbot*
disallow:/
結果:偽
User-agent: 008
Crawl-delay: 2
user-agent: Accoona
User-Agent: Googlebot
User-Agent: aipbot*
disallow:/
結果:真の
Mais bien sur!しかし、User-Agentの説明には空白文字が含まれている可能性があります。これをキャプチャするには '[a-zA-Z0-9 \ *]'(https://regex101.com/r/ximRMo/4)を実行します。 – LeMoussel