2016-06-24 5 views
0

ドメインに.htaccessパスワードでブロックされているWebサイトインスタンスがあります。会社のネットワークなど一部のIPは許可されています。.htaccessパスワード保護されたサイトは検索エンジンから隠されていますか?

  • (明らかにこれを100%保証することはできませんが)何のインバウンドリンクはありません

  • サイトがrobots.txtの

  • メタタグが従うように設定されているロボットやインデックス

  • を持っていません

これらの条件がすべて満たされている場合、検索エンジンがサイトのインデックスを作成する方法はありますか?私は思っていませんが、私が知らなかった抜け穴がないことを確認したいと思います。

答えて

1

パスワードで保護されたページは、検索エンジン にアクセスできません。

検索エンジンのロボットは通常、クロールページにログインできません。 ログイン後のコンテンツは検索インデックスに入りません。

ソース:http://www.yourseoplan.com/is-password-protected-content-indexable-by-search-engines/

またGoogle employeeからこの記事を参照してください。

いいえ、Googleのクローラは、ログイン保護されたページにアクセスすることはできません。

ソース:ゲイリーIllyes、グーグル、https://productforums.google.com/forum/#!topic/news/2SdcGEWht1o

0

私はどのクローラがポイントの.htaccessで、任意のコンテンツに到達する前に停止されますかなり確信しているがそれはだかのように見て、パスワードを要求します.htaccessパスワードを持っている全体のポイント。

教育的な目的で冗長性を持たせたい場合は、さまざまなブラウザからプライベートタブでテストし、ソケットで生のリクエストを送信して戻ってくる出力を確認することができます。ここでは、生のHTTPリクエストを送信したい方法を説明ページがあります:https://www3.ntu.edu.sg/home/ehchua/programming/webprogramming/HTTP_Basics.html

ここでは、彼らはあなたがhttp://nowhere123.com/docs/index.htmlでページを取得するに取り掛かるだろう方法を説明し、そのページからの抜粋は、です:

GET /docs/index.html HTTP/1.1 
Host: www.nowhere123.com 
Accept: image/gif, image/jpeg, */* 
Accept-Language: en-us 
Accept-Encoding: gzip, deflate 
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1) 
(blank line) 

あなたはほとんどのLinuxディストリビューションでは確かに利用可能であり、おそらくWindowsでも利用可能な、telnetを使って生のリクエストを送ることができます。

私は先に行って、知られている.htaccessのパスワードゲートウェイと自分のサーバの1つに(修正パスとホストとの)この要求を発行し、この応答を得た:この多分

HTTP/1.0 401 Unauthorized 
Date: Fri, 24 Jun 2016 15:08:26 GMT 
WWW-Authenticate: Basic realm="Restricted Area" 
Content-Type: text/plain 
Content-Length: 19 

Invalid CredentialsConnection closed by foreign host. 

だから... ...が手伝う。

関連する問題