であるため/前方Googleのを禁止するために私を強制し、私はこのようなものをたくさん持っているfail2banの:は私のApacheのログでは私のログ
<IP ADDRESS> - - <DATE> "GET /forward?path=http://vary_bad_link_not_for_children" <NUM1> <NUM2> "-" <String>
<NUM1>:302または404
<NUM2>:5XX、6XXまたは11XX
<文字列>:
「のMozilla/5.0(互換性があります。 AhrefsBot/5.1; + http://ahrefs.com/robot/)」
の "Mozilla/5.0(互換; MJ12bot/v1.4.5; http://www.majestic12.co.uk/bot.php?+)"
の "Mozilla/5.0(互換;のGooglebot/2.1; + ...リンク)"
の "Mozilla/5.0(互換; Exabot/3.0; + ...リンク)"
等...
私はこの正規表現でfail2banのために刑務所を作っています
failregex = ^<HOST> .*"GET .*/forward\?path=
禁止されているIPアドレス(ログに記載されている< IPアドレス>を参照)は、googleやその他のよく知られている企業のIPアドレスです。
私は本当にこのような理由を理解していません。私はなぜGoogleと他の企業を禁止すべきなのか、もしそうでなければ、私のサーバーへのそれらの不適切な要求をすべて受け入れるべきなのです。それは悪い説明したように、私は、私の質問を明確にしたいと思います
:
1-なぜGoogleのIP(および他の既知の企業が)「ポルノ」のそれらの種類を行っているが
2 - であるを要求します"/ forward?path = ..."という意味は、それはApacheの機能ですか?
3 - 私のサイトを参照する "良い"ボットを止めることなくこの問題を処理する方法。
助けを借りてありがとう!
これらの検索ボットに '/ forward'の訪問を停止しますか?もしそうなら、それをあなたの[robots.txt](http://www.robotstxt.org/)で禁止すべきです。そうでない場合は、質問を編集して必要な動作を記述する必要があります。 – Leopold
私の問題は、私が知っているそれらの(知っている)ボットを私のサイトに訪れることに同意することですが、私はそれらが不適切な(ポルノ)URL(パス= http:// vary_bad_link_not_for_children)を検索することに同意しません。私はなぜGoogleのIPがこの種のコンテンツを探しているのか理解していません...私が明らかであれば教えてください。 – Baud
私は私の質問を更新しました、私はそれがより明確であることを願っています。 – Baud