2016-03-23 1 views
1

私のプロジェクトでrobots.txtsitemap.xml.htaccessを使用しています。私はGoogle Webマスターツールで提出するとsitemap.xmlのURLにアクセスできます。htaccessを正しく使用してリダイレクトする

のrobots.txt

User-Agent: * 
Disallow: 

sitemap.xmlと

<url> 
    <loc>http://www.example.de/</loc> 
    <changefreq>daily</changefreq> 
</url> 
<url> 
    <loc>http://www.example.de/blog/article/</loc> 
    <changefreq>daily</changefreq> 
</url> 
<url> 
    <loc>http://www.exampe.de/blog/article/example-article</loc> 
    <changefreq>daily</changefreq> 
</url> 

の.htaccess

RewriteRule ^(.*)blog/article/$ $1article.php 
RewriteRule ^(.*)blog/article/example-article$ $1blog/example-article.php 

マイフォルダ構造:

├───blog 
│ └─── example-article.php 
├─── sitemap.xml 
├─── robots.txt 
├─── .htaccess 
├─── article.php 
├─── ... 

Googleウェブマスターツールは言う:

http://www.example.de/blog/article/ 
http://www.example.de/blog/article/example-article 

は、私はすべてをクロールすることができ事実により可能ではないのrobots.txtによってブロックされます。

私の間違いはどこですか?

+0

あなたのrobots.txtがブロックしている可能性があります。 robots.txtが正しく表示されません。 –

+0

ええ、それはrobots.txtによってブロックされるという事実です。しかし、間違いはどこにありますか? mod_rewritedのURLをロボットで使用することはできませんか?私はそれらのようにインデックスを作成したいので。 – CodeVolunteer

答えて

2

用途:のrobots.txt

User-Agent: * 
Disallow: /only_folder_name_you_disallow/ 

あなたはグロブと正規表現はいずれかのユーザーエージェントでサポートされているか、ラインを禁止されていないこともAllow

注意を使用することはできません。 User-agentフィールドの '*'は、「任意のロボット」を意味する特別な値です。具体的には、「User-agent:bot」、「Disallow:/ tmp/*」、「Disallow:* .gif」のような行は使用できません。 http://www.robotstxt.org/robotstxt.html

+0

あなたの答えをありがとう。やってみます。理由は何ですか、私は "許可"を使用できませんか?私はこれを非常に頻繁に見てきました。それとも私の場合にはうまくいかないのですか? – CodeVolunteer

+0

ユーザーエージェント:* Disallow: robots.txt、.htaccess、またはsitemap.xmlの問題が同じではないので、同じエラーが表示されますが、私はベットします.htaccessに。エラーの原因がわかりますか? – CodeVolunteer

+1

「許可」はロボット排除プロトコルに含まれていません。たとえ一部のロボットがそれを使用していても。しかし、1つのフォルダを許可し、すべてを禁止すると、私には明らかではありません。あなたのhtaccessでは、あなたは 'blog ...'とリンクを書き換えますが、 'robots.txt'ではそうではなく、問題ではありません。あなたはGoogleに 'robots.txt'と書いた... Google Webmaster Toolsで' robots.txt'をもう一度試してみてください。そしてあなたの 'sitemap.xml' ... – Croises

関連する問題