2009-08-20 9 views
7

Googlebotは、不適切なクエリ文字列パラメータを使用してGoogleのサイトのインデックスを作成することがあります。私はそれがどのようにこのクエリ文字列パラメータを取得しているのかわかりません(悪いリンクで私たちにリンクしているサイトは表示されず、私たちのサイトには何の価値もありません)。悪いパラメータは、サイトが500エラーを投げる原因となります。Google(またはGooglebot)が500エラーを返すページのインデックスを作成するのはなぜですか?

私は、Googleが500エラーを返すページのインデックスを作成しないという印象を受けましたが、それはそれであることが判明しました。だから今私は2つの質問があります:

1)Googlebotがランダムな不正なクエリ文字列値を挿入するのはなぜですか? (私はこの質問に対する答えは本当に気にしませんが、それを避けるために何かできることがあれば問題は解決します)

2)Googleが500エラーを返すページをインデックス化するのはなぜですか?

はここでGooglebotが作成され、誤ったリンクのいずれかであるとGoogleがインデックス化していること:

http://www.pbs.org/teacherline/catalog/browse/?sa=4&gb=baqhuxts&gb=20&gb=21&num=20&page=2&js=0&sa=1

悪いパラメータはギガバイト=のbaqhuxtsです。パラメータ 'gb'は整数であると予想されます。クエリ文字列からそのパラメータを削除すると、素晴らしいカタログページが表示されます。 nofollowをとrobots.txtのソリューションについて

:[編集済み]

私は今、私はバカだとインデックスに検索ロボットページを伝えるメタタグを置くことを実現します。それはやるべきことだった。私はそれらを削除しています。 W-(

あなたがこの悪いパラメータで10ページのインデックスを付けていることがわかりますが、これらのページのそれぞれは500エラーを返します。Googleがこれらが有効なページであると考えている人は誰ですか?

+0

特にクエリ文字列には何が間違っていますか?つまり、有効な結果を得るには、そのURIを変更する必要がありますか?それは何が起こっているのかを説明するのに役立ちます。 – VoteyDisciple

+0

良いキャッチ@voteydisciple。私は、クエリー文字列に何が間違っているかの説明を追加しました。 'gb'パラメータは整数であると予想されます。 – shawnr

+0

ウェブサイトの下部にある著作権は1年前です。 – Davis

答えて

4

あなたはそれがあなたのメタタグでこれを持っていることによってインデックスにGoogleに言っているので、それはおそらくです:

<meta name="robots" content="index,follow"> 

はそれを削除してください! :)

+0

ありがとう、ダン! – shawnr

1

残念ながら、私は#1にのみ答えを知っている:

Googleは、Googleのツールバーを持つ人々が存在してはいけないページに行くので、そのような奇妙なページをクロールし、その閲覧情報がGoogleに送信され、なぜあなたは意志これがあります。ビジネスがインデックスに登録されていないページ、たとえばどこからでもリンクされていないphpmyadminページなどがあります。

+0

私は、あなたが描写したことが起こることを理解しています。それは確かに難しいことです。しかし、更新された質問を参照してください - 私はカタログURLに横断的な禁止を実装したくありません。 または、私の500ページにロボットのインデックス作成を許可しないメタタグが必要だと言っていますか? – shawnr

関連する問題