2011-07-18 21 views
0

私は世界中のクライアントを持つ会社のサイトを開発しています。サイトはイタリア語(ローカル)と英語の2言語で提供されます。 訪問者がサイトにアクセスすると、私はIPをチェックします。イタリアから来た場合、イタリア語でサイトを表示します。そうでない場合は英語で表示します。もちろん、言語を手動で無効にするオプションもあります。 検索エンジンのボットがページを索引付けするためにサイトを調べると、正確にはどうなりますか?多言語のサイトと検索エンジン

  • 通常、クローラは常に彼らはクッキー(およびそのセッション)を受け入れることができないため、クローラはイタリア語のページを表示するには、「言語の変更」リンクを「クリック」しても、米国ベースのIPS
  • を持って、私は」することができます言語セットを維持するか、選択したものを追跡する

したがって、検索エンジンが両方の言語をスキャンしてインデックスを作成する方法でこのような状況を処理するにはどうすればよいですか。

答えて

2

Googleには実際にこの件に関するウェブマスター向けガイドラインの記事があります。あなたは、あなたが提起した問題に具体的に対処するので、見てみたいです。http://www.google.com/support/webmasters/bin/answer.py?answer=182192

+0

私が入手したものから言語に基づいた自動リダイレクト(少なくともボットのユーザエージェントではない)を置くべきではありません(おそらくホームページにありますか?)、langをサブフォルダ/サブドメインだけで区切ってください。この方法で、ボットはすべての言語をスキャンする必要がありますか? –

+0

言語ごとに別々のサブドメイン/ディレクトリがある場合は、大丈夫です。各言語につながるボットアクセス可能なリンクがあることを確認してください。 – kbad

0

私はサブドメインを使用したい:

eng.mysite.com/whatever 
it.mysite.com/whatever 

は、次に、これらの言語のサブドメインのそれぞれのホームページを指すサイトマップを持っている、と彼らはすべてうまくクロールする必要があります。

0

次のアプローチを使用することができます。

  • は、ユーザエージェントが好む言語用のAccept-Languageヘッダ($_SERVER['HTTP_ACCEPT_LANGUAGE'])をスキャンします。これは通常、自国のIPアドレスを確認するよりも信頼性が高いです。
  • ユーザーエージェントのヘッダー($_SERVER['HTTP_USER_AGENT'])を確認し、リクエストが "Googlebot"や "Yahoo! Slurp"などの検索エンジンからのものかどうかを確認します。
+0

クローラーはAccept-Languageを使用しますか? –