私のプロジェクトでrobots.txt
とsitemap.xml
と.htaccess
を使用しています。私はGoogle Webマスターツールで提出するとsitemap.xmlのURLにアクセスできます。htaccessを正しく使用してリダイレクトする
のrobots.txt
User-Agent: *
Disallow:
sitemap.xmlと
<url>
<loc>http://www.example.de/</loc>
<changefreq>daily</changefreq>
</url>
<url>
<loc>http://www.example.de/blog/article/</loc>
<changefreq>daily</changefreq>
</url>
<url>
<loc>http://www.exampe.de/blog/article/example-article</loc>
<changefreq>daily</changefreq>
</url>
の.htaccess
RewriteRule ^(.*)blog/article/$ $1article.php
RewriteRule ^(.*)blog/article/example-article$ $1blog/example-article.php
マイフォルダ構造:
├───blog
│ └─── example-article.php
├─── sitemap.xml
├─── robots.txt
├─── .htaccess
├─── article.php
├─── ...
Googleウェブマスターツールは言う:
http://www.example.de/blog/article/
http://www.example.de/blog/article/example-article
は、私はすべてをクロールすることができ事実により可能ではないのrobots.txtによってブロックされます。
私の間違いはどこですか?
あなたのrobots.txtがブロックしている可能性があります。 robots.txtが正しく表示されません。 –
ええ、それはrobots.txtによってブロックされるという事実です。しかし、間違いはどこにありますか? mod_rewritedのURLをロボットで使用することはできませんか?私はそれらのようにインデックスを作成したいので。 – CodeVolunteer