2012-03-04 14 views
0

特定のWebページの<head>セクションのみを取得したいと思っていたリンクスクレイピングコードを書いています。明らかに、HEADリクエストが何であるか混乱していました。私はそれが正確にやろうと思っていたからです。代わりに、単にHTTPヘッダーを返します。HEADリクエストとWebページの「<head>」のみを取得する

文書全体を取得せずに、特定のページの<head>セクションのみをフェッチする方法はありますか?

答えて

2

いいえ、HTMLプロトコルについては何も知られていません(HTMLについてはまったく知らない)。適切なGETまたはPOSTを実行する必要があります.HTMLパーサーを使用して必要なデータを抽出します。

戻ってくるものを制限するためにできる唯一のことは、Rangeヘッダーを使用することですが、リクエストしたデータ量については、あなたの側で推測されます。

+0

良い回答ありがとう – Yarin

関連する問題