私は最近、コンテンツ用のウェブサイトをたくさん巡ってきましたが、これまでのところサイトがこれほど抵抗を感じることができなかったのは驚きです。理想的には、私が取り組んでいるサイトは簡単に収穫できないはずです。だからボットがあなたのウェブコンテンツを収穫するのを止める最善の方法は何か不思議に思っていました。 明白な解決策:コンテンツがクロールされないようにするための最良の手段は何ですか?
- robots.txtの(いや右)
- IPブラックリスト
は、ボットの活動をキャッチするために何ができますか?データ抽出を困難にするためには何ができますか?それらに悪いデータを与えるために何ができるのですか? SEOの懸念について
、データの特定のブロックへのアクセスを制限する方法がある(種類のテキストの<nofollow>
ブロックのように?) ジャストアイデアを探して、ない右/間違った答え
うん...インターネットに接続しないでください。 –