は、私は、WebページのHTMLを抽出する必要が 私は次のgetを作り、グルーヴィーでHTTPuilderを使用しています:私は探検するときHTTPBuilder - WebページのHTMLコンテンツを取得するにはどうすればよいですか?
def http = new HTTPBuilder('http://www.google.com/search')
http.request(Method.GET) {
requestContentType = ContentType.HTML
response.success = { resp, reader ->
println "resp: " + resp
println "READER: " + reader
}
response.failure = { resp, reader ->
println "Failure"
}
}
私が得る応答、同じHTMLが含まれていない私が見ることができますwww.google.com/searchのhtmlソース実際、それはHTMLでもなく、ページのhtmlソースで見ることができる同じ情報を含んでいません。 headers.Accept = 'text/html、application/xhtml + xml、application/xml; q = 0.9,/; q = 0.8'、headers.Accept = 'textなどの異なるヘッダーを設定しようとしました。/html '、ユーザーエージェントの設定など)、結果は同じです。 http builderを使用してwww.google.com/search(または任意のウェブページ)のhtmlを取得するにはどうすればよいですか?