通常のWebブラウザと同様に、スクレイパーやスパムロボットが構築されないという理由があります。このことを念頭に置いて、要注意を見るだけで大胆なスパムロボットを見つける方法があるはずです。スパムボットの検出に使用できるHTTPヘッダーフィールドはありますか?
HTTPヘッダーを分析する方法はありますか、これは単なるパイプドリームですか?
Array
(
[Host] => example.com
[Connection] => keep-alive
[Referer] => http://example.com/headers/
[Cache-Control] => max-age=0
[Accept] => application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
[User-Agent] => Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/7.0.517.44 Safari/534.7
[Accept-Encoding] => gzip,deflate,sdch
[Accept-Language] => en-US,en;q=0.8
[Accept-Charset] => ISO-8859-1,utf-8;q=0.7,*;q=0.3
)
信頼できるシグネチャを持つボットはほんの数です。ほとんどのフォームスパムクローラーはリプレイ攻撃を実行するか、またはActiveXゾンビです。 (しかし、目標サイトに大きく依存しています。) 'Referer'-linkbotsはまれです。しかし、 "悪い行動"を見てください。 – mario