2009-03-16 11 views
2

スパイダー/ロボットはファイル名のスペースを削除しますか?したがって、ウェブサイトのファイル名のスペースは避けてください。ウェブサイトスパイダー/ロボットがファイル名の空白を削除する

+0

まず、これは都市の伝説のようです。さらに重要なことは、スパイダリングアプリケーションが特定の名前を処理できない場合、なぜあなたは気にしますか? –

+0

私は現在、自分のウェブサイトから定期的にエラーが発生しています。それはスパイダーのようだから、実際の生活の問題です。 私は自分のサイトにできるだけアクセスしやすく、エラーを見て時間を浪費したくないので気になります! – AJM

答えて

3

のようなものが含まれているURLを処理するために好きではないかもしれません。 URLではエスケープする必要があるかもしれません。手動で(テストするために)入力するのは難しく、見落とされる可能性があります。

正しく動作しないいくつかの変わったボットにも問題があるかもしれませんが、私は気づいていません。

3

私はあなたが、スクリプトまたはサーバーがファイル名を処理するために、これはエラーにつながる場合があるどのソフトウェアを知っていることはありません一般的には、ウェブサイトのファイル名にスペースを回避し

ThisIsAnExample 
This_is_an_example 

のようないくつかの他の方法を使うべきだと思います。また、あなたのウェブサイトを使っている人は、私はかつて私は大文字と小文字だけでなく、特殊文字(使用のみASCII)とスペースを混合避けるべきであるということを学びました

This%20is%20an%20example 
+0

スペースは、ブログ/コメントスクリプト内の一部のリンク検出スクリプトでも認識されないため、URLがユーザー生成コンテンツのリンクとして表示される可能性が低くなります。 – Jacco

2

ロボットの正確な動作はわかりませんが、すべてではないにしてもほとんどがウェブサイトのファイル名のスペースを処理できるはずです。

しかし、ベストプラクティスでは、Web上のファイル名にスペースを使用することをお勧めします。これは、ブラウザがまだスペースと%20の間で差別化している数年前の今日の問題ではありませんが、この慣習に従うことはできません。

+0

それを忘れると、ほとんどのロボットは駄目です。彼らはURLのような基本的なことを処理できるはずですが、多くは失敗します。 – Jacco

3

私はこれに関してschnaaderと一緒です。可能であれば、間違いなくスペースを避けてください。これは、this oneのような厄介なURLエンコーディングの問題を避けるのに役立ちます。

しかし、とにかくそれらを使用する必要があることがあります。気まぐれなブラウザを使って訪問者を支援するために少し余分な作業をしなければならないかもしれないことに気づくだけです。

1

「_」または「 - 」の問題を使用するロボットでは、注意してください。

I.e. Googleではダッシュを単語区切りとして扱っているため、「アーカイブ記事」のURLは2語、「アーカイブされた記事」は1のように見えます。

+0

Hmm?あなたは "archived_articles"は "archivedarticles"と同じであると言っていますか?なぜ、アンダースコアを使用するのですか? – core

+0

これはもはや意味のないものです。下線は現在単語区切り文字であり、Googleの宣言:http://news.cnet.com/8301-10784_3-9748779-7.html – Jacco

関連する問題