Webサイトの.htaccess + robots.txtをデバッグしようとしていますが、robots.txtを使用してブロックしたファイルにアクセスするためにcURLまたはwgetを使用したい.htaccessファイルを経由して別の場所にリダイレクトする必要があるページがWebサイトの.htaccess + robots.txtをテストするためにwgetまたはcurlを使用する
私は
User-agent: *
Disallow: /wp/wp-admin/
まだ私のrobots.txtに次きた、私はまだそれをクロールすることができ
wgetの
$ wget http://xxxx.com/wp/wp-admin/
SYSTEM_WGETRC = c:/progra~1/wget/etc/wgetrc
syswgetrc = C:\Program Files (x86)\GnuWin32/etc/wgetrc
--2017-08-28 07:37:05-- http://xxxx.com/wp/wp-admin/
Resolving xxxx.com... 118.127.47.249
Connecting to xxxx.com|118.127.47.249|:80... connected.
HTTP request sent, awaiting response... 302 Found
Location: http://xxxx.com/wp/wp-login.php?redirect_to=http%3A%2F%2Fxxxx.com%2Fwp%2Fwp-
admin%2F&reauth=1 [following]
--2017-08-28 07:37:12-- http://xxxx.com/wp/wp-login.php?redirect_to=http%3A%2F%2Fxxxx.com%2Fwp%2Fwp-admin%2F&reauth=1
Connecting to xxxx.com|118.127.47.249|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 2891 (2.8K) [text/html]
Saving to: `[email protected]_to=http%3A%2F%2Fxxxx.com%2Fwp%2Fwp-admin%2F&reauth=1'
100%[==============================================================================>] 2,891 --.-K/s in 0.1s
2017-08-28 07:37:17 (22.2 KB/s) - `[email protected]_to=http%3A%2F%2Fxxxx.com%2Fwp%2Fwp-admin%2F&re
auth=1' saved [2891/2891]
カール
$ curl -L xxx.com/wp/wp-admin -o wp-admin.html
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 1147 100 1147 0 0 107 0 0:00:10 0:00:10 --:--:-- 280
0 0 0 0 0 0 0 0 --:--:-- 0:01:37 --:--:-- 0
100 2891 100 2891 0 0 17 0 0:02:50 0:02:42 0:00:08 234
どちらのwgetやカール尊敬のrobots.txt は、どのように私の.htaccess +のrobots.txtをチェックする方法はありますか?ありがとう!
グーグルコンソール以外のツールがありますか。私は自分のウェブサイトでspecfic .txtファイルをシミュレートしようとしています。彼らはGoogleで簡単にクロール可能かどうかを確認していますか? –
https://en.ryte.com/free-tools/robots-txt/助けてもらえますが、誰でも見ていると 、次にロボットは1であるため、robots.txtを使って非公開にしたいものを隠すことはできませんあなたが隠そうとしていることを最初に見つけます。 – jrtapsell
実際に私は隠そうとしていない、実際には、私のウェブサイトの '.txt'ファイルがボットでアクセス/クロールできるかどうかを意図的に知りたい場合 –