2009-06-26 8 views
0

Webパーサーは、Webページ上の静的テキストと動的テキストを区別できますか? は、例えば、文字列がウェブページ上にあるウェブパーサーは静的テキストと動的テキストを区別できますか?

こんにちは「ファンタスティックフォー」本で

は、「こんにちは」静的なデータであり、「ファンタスティック・フォー」は、(たとえば、フォームを移入された動的データであります

Webパーサーは、どのコンテンツが静的で動的なコンテンツであるかを検出できますか?

+0

"静的および動的コンテンツ"の意味を明確にすることはできますか? JavaScriptとHTMLで生成されるコンテンツまた、「Webパーサ」とはどういう意味ですか?クローラを意味しますか? –

+0

静的なHTMLとサーバーが生成したHTMLについて話しているなら、あなたは知ることができません。あなたがクライアント側で実行しているいくつかのJavaScriptについて話しているなら、それは依存しますが、難しいと思います。もう少し詳しく説明できますか? – Groo

+0

私はサーバーが生成したHTMLについて話しています – Annibigi

答えて

3

私はそれができないと思います。クライアントはサーバ内で実行中のコードについて何も知ることができないので、PHP、ASP、その他の言語でテキストが生成されているかどうか、あるいは静的であるかどうかはわかりません。

0

URLヘッダーとHTTPヘッダーを見れば、ファイルが静的に(ファイルシステムから直接)提供されたか、生成されたものかを知ることができます。しかし、ほとんどの "Webページパーサ"はこの情報を得ておらず、生成されたほとんどすべてのページには静的ビットがあります。 (これらはソースコードに直接含まれている場合もあれば、テンプレートやSSIファイルからのものもあります)。これらの静的ビットを他と区別することは不可能です。