私のサイトを酷使してCPU使用量が400%を突破した後、私はrobots.txtを作成してルートに配置しました。例えば "www.example .com/":BingBotとBaiduSpiderはrobots.txtを尊重していません
User-agent: *
Disallow:/
Googleはこのファイルを尊重し、Googleのログファイルにはこれ以上の出来事はありません。 しかしBingBot & BaiduSpiderはまだ私のログに(そしてたくさんの)表示されます。
&帯域幅があり、私のホスティングプロバイダがアカウントを一時停止しようとしていたため、私はすべてのページを削除しました(厄介なスクリプトがあった場合)、クリーンページをアップロードして、 .htaccess &のIPアドレスでrobots.txtファイルを作成しました。
私は正しいステップを実行したことを確認するためにどこでも検索しました(まだ.htaccessの "ReWrite"オプションは試していません)。
誰でも私がしたことが仕事をするべきであることを確認できますか? (私がこのベンチャーを開始して以来、6日間でCPU使用率は120%に低下しましたが、少なくともIPアドレスをブロックするとCPU使用率が通常の5〜10%に低下するはずです)。
は悲しげに、robots.txtのは、ファイアウォールへのアクセス権を持っているならば、あなたは完全にそれらをブロックすることができ、「紳士協定」で、他の人々はあなたが持っている同じ問題を抱えています/www.webmasterworld.com/search_engine_spiders/4348357.htm(このリンクを禁止するIPアドレス) –
こんにちはハラルド、リンクをありがとう。それらをIPアドレスで完全にブロックしました。彼らが私のrobots.txtとメタタグを読んでいない理由を推測する(私が変わった)。 CPU使用率が51%に下がりましたので、私はいくつかのIPアドレスを使って、robots.txtのルールとメタタグのルールを読んで、それがどうなるか見ていきます。もう一度、リチャード – Richard