私は、次のコマンドを使用して、LinkedInのからダウンロード1ページにしようとすると:ブラウザを使用して、ユーザーがLinkedInのにアクセスすることができますのでLinkedinはユーザーリクエストとクローラリクエストの違いをどのようにしますか?
HTTP/1.1 200 Connection established
HTTP/1.1 999 Request denied
Date: Tue, 30 Aug 2016 08:19:35 GMT
X-Li-Pop: prod-tln1-hybla
Content-Length: 1629
Content-Type: text/html
:
私は999ステータスコードを取得ページの場合、はロボットとユーザーの間で違いを生むことを意味します。
そうでないユーザーがrobots.txtの最後に次の行のためにLinkedInのページにアクセスすることを許可されません。
User-agent: *
Disallow:/
ので、LinkedInのは、ブラウザや他の人からの要求の違いを作ることができます。 どのようにそうするのですか?
あなたは多くの詳細を見つけることができます[ここ](https://techcrunch.com/2016/08/15/) linkedin-sues-scrapers /)である。 –
面白いですが、私の質問は***どのように彼らはそうしているのですか*** ***なぜ彼らはそれをしますか? – Gabsn
記事を読むと、 FUSE、Quicksand、Sentinelと呼ばれるこれらのツールは、LinkedInユーザーのWebトラフィックを監視し、ユーザーが見ることができる他のプロファイルの数や、ユーザーがそれらのプロファイルを表示する速度を制限しています" –