2012-01-09 9 views
0

ウェブサイトは、ブラウザ上のユーザだけでなく、プログラム、ボット、クローラにアクセスすることができます。私はPythonでGoogle App Engine上で実行されているWebサイトを持っています。非静的なHTMLページは、Pythonプログラムによって結合、結合、ループすることによって生成されます。ただし、これらのページを生成するためにユーザー入力が必要ないという意味では、動的ページでもありません。 Pythonによるコンテンツの生成は、利便性、簡潔さ、保守の容易さのためだけであり、URLによって完全に設定されています。私のウェブサイトがどのようにプログラムに現れるかをテストしてください

検索エンジンの中には、動的ページのインデックスを作成できないものがあります。私は、これらのページが「動的」であるかどうか、つまりそのようなボットで通常のメタデータとコンテンツのクロールやインデックス作成ができるかどうかを知りたいのですが、一般的に URLがボットに表示されます検索エンジンで使用されているようなクローラを使用しているため、特定のURLがクロールできないことがわかります。

利用可能なリソースやテクニックを知っている人は、本当に役に立ちます。

答えて

2

Lynxは、検索ボタンにページがどのように表示されるかを示すテキストベースのブラウザです。古代、試して真実。

+0

私はLynxについて知っていますが、それは私には別のブラウザであるように思われたので、私はそれを試して考えたことはありませんでした。しかし、あなたの提案に感謝、私はそれを試し、私が得る結果を参照してください。 –

3

一部の検索エンジンでは動的ページをインデックスできません。

クライアントがスクリプトを実行したり、静的ファイルを読み取ったりしてコンテンツを取得した場合、クライアントはそのことを知ることができません。

ほとんどの検索エンジンではクライアント側のJavaScriptは実行されません。ほとんどの検索エンジンはフォームを送信しません。

あなたのコンテンツが(HTML内にある)リンクをたどってアクセスできる場合、検索エンジンはページを取得できます。

+0

明るくて、ありがとう。 –

関連する問題