0
以下のコードを実行して、ジョブの実行時にエラーが発生しました。ページはulrsに読み込まれますが、場所はWebページから抽出されません。rウェブスクレイピングコードを実行しようとしましたが、エラーが発生しました
library(data.table)
library(XML)
pages<-c(1:12)
ulrs <- rbindlist(lapply(pages, function(x)
{url <- paste("http://www.r-users.com/jobs/page/",x,"/",sep = " ")
data.frame(url)}),fill = TRUE)
joblocations <- rbindlist(apply(ulrs,1,function(url){
doc1 <- htmlParse(url)
locations <- getNodeSet(doc1,'//*[@id="mainContent"]/div[2]/ol/li/dl/dd[3]/span/text()')
data.frame(sapply(locations,function(x){xmlValue(x)}))
}),fill = TRUE)
Error: failed to load external entity "http://www.r-users.com/jobs/page/%201%20/"
こんにちは、7月...まだこのエラーが発生しています open.connection(x、 "rb")のエラー:HTTPエラー404。 –
ただ答えを編集しました。問題は 'paste'コマンドの' sep'パラメータにあります。 'sep =" "'はうまくいくはずですが、WebスクレイピングのためのURLを構築するときは、代わりに 'paste0'を使うのが最善でしょう。 – Jul
ありがとうございました..今働いています.... –