多言語のサイトと検索エンジン

私は世界中のクライアントを持つ会社のサイトを開発しています。サイトはイタリア語（ローカル）と英語の2言語で提供されます。訪問者がサイトにアクセスすると、私はIPをチェックします。イタリアから来た場合、イタリア語でサイトを表示します。そうでない場合は英語で表示します。もちろん、言語を手動で無効にするオプションもあります。検索エンジンのボットがページを索引付けするためにサイトを調べると、正確にはどうなりますか？多言語のサイトと検索エンジン

通常、クローラは常に彼らはクッキー（およびそのセッション）を受け入れることができないため、クローラはイタリア語のページを表示するには、「言語の変更」リンクを「クリック」しても、米国ベースのIPS
を持って、私は」することができます言語セットを維持するか、選択したものを追跡する

したがって、検索エンジンが両方の言語をスキャンしてインデックスを作成する方法でこのような状況を処理するにはどうすればよいですか。

出典

2011-07-18 Sandro Antonucci

Googleには実際にこの件に関するウェブマスター向けガイドラインの記事があります。あなたは、あなたが提起した問題に具体的に対処するので、見てみたいです。http://www.google.com/support/webmasters/bin/answer.py?answer=182192

出典

2011-07-18 23:10:10 kbad

私が入手したものから言語に基づいた自動リダイレクト（少なくともボットのユーザエージェントではない）を置くべきではありません（おそらくホームページにありますか？）、langをサブフォルダ/サブドメインだけで区切ってください。この方法で、ボットはすべての言語をスキャンする必要がありますか？ –

言語ごとに別々のサブドメイン/ディレクトリがある場合は、大丈夫です。各言語につながるボットアクセス可能なリンクがあることを確認してください。 – kbad

私はサブドメインを使用したい：

eng.mysite.com/whatever 
it.mysite.com/whatever

は、次に、これらの言語のサブドメインのそれぞれのホームページを指すサイトマップを持っている、と彼らはすべてうまくクロールする必要があります。

出典

2011-07-18 22:57:53 AlienWebguy

次のアプローチを使用することができます。

は、ユーザエージェントが好む言語用のAccept-Languageヘッダ（$_SERVER['HTTP_ACCEPT_LANGUAGE']）をスキャンします。これは通常、自国のIPアドレスを確認するよりも信頼性が高いです。
ユーザーエージェントのヘッダー（$_SERVER['HTTP_USER_AGENT']）を確認し、リクエストが "Googlebot"や "Yahoo! Slurp"などの検索エンジンからのものかどうかを確認します。

出典

2011-07-18 22:59:22

クローラーはAccept-Languageを使用しますか？ –

多言語のサイトと検索エンジン

答えて

関連する問題