Googlebotは、不適切なクエリ文字列パラメータを使用してGoogleのサイトのインデックスを作成することがあります。私はそれがどのようにこのクエリ文字列パラメータを取得しているのかわかりません(悪いリンクで私たちにリンクしているサイトは表示されず、私たちのサイトには何の価値もありません)。悪いパラメータは、サイトが500エラーを投げる原因となります。Google(またはGooglebot)が500エラーを返すページのインデックスを作成するのはなぜですか?
私は、Googleが500エラーを返すページのインデックスを作成しないという印象を受けましたが、それはそれであることが判明しました。だから今私は2つの質問があります:
1)Googlebotがランダムな不正なクエリ文字列値を挿入するのはなぜですか? (私はこの質問に対する答えは本当に気にしませんが、それを避けるために何かできることがあれば問題は解決します)
2)Googleが500エラーを返すページをインデックス化するのはなぜですか?
はここでGooglebotが作成され、誤ったリンクのいずれかであるとGoogleがインデックス化していること:
http://www.pbs.org/teacherline/catalog/browse/?sa=4&gb=baqhuxts&gb=20&gb=21&num=20&page=2&js=0&sa=1
悪いパラメータはギガバイト=のbaqhuxtsです。パラメータ 'gb'は整数であると予想されます。クエリ文字列からそのパラメータを削除すると、素晴らしいカタログページが表示されます。 nofollowをとrobots.txtのソリューションについて
:[編集済み]
私は今、私はバカだとインデックスに検索ロボットページを伝えるメタタグを置くことを実現します。それはやるべきことだった。私はそれらを削除しています。 W-(
あなたがこの悪いパラメータで10ページのインデックスを付けていることがわかりますが、これらのページのそれぞれは500エラーを返します。Googleがこれらが有効なページであると考えている人は誰ですか?
特にクエリ文字列には何が間違っていますか?つまり、有効な結果を得るには、そのURIを変更する必要がありますか?それは何が起こっているのかを説明するのに役立ちます。 – VoteyDisciple
良いキャッチ@voteydisciple。私は、クエリー文字列に何が間違っているかの説明を追加しました。 'gb'パラメータは整数であると予想されます。 – shawnr
ウェブサイトの下部にある著作権は1年前です。 – Davis