XMLの知識が非常に少ないと言って始めます。Webスクレイピングが突然停止した
私は2、3日前に、次のコードは完全に働いたまでよりもあなたを約束:
そのウェブページからの最初のテーブルを抽出し、私が乗ると、私が望んで行うことを許可されlibrary("rvest")
url<-"https://en.wikipedia.org/wiki/Opinion_polling_for_the_next_United_Kingdom_general_election"
H<-read_html(url)
table<-html_table(H, fill=TRUE)
Z<-table[1]; Z1<-Z[[1]]
とパッティングをそれはデータフレームZ1
にあります。しかし、これが突然動作を停止しましたと、私はエラーメッセージが出続ける:私はH
を見てみると
Error in if (length(p) > 1 & maxp * n != sum(unlist(nrows)) & maxp * n != :
missing value where TRUE/FALSE needed
リストであることはもはやいないようですし、次のようになります。
{xml_document}
<html class="client-nojs" lang="en" dir="ltr">
[1] <head>\n<meta http-equiv="Content-Type" content="text/html; charset=UTF-8 ...
[2] <body class="mediawiki ltr sitedir-ltr mw-hide-empty-elt ns-0 ns-subject ...
html_table
では明らかに失敗しています。
これはどこから始めるのか本当に分かりません。
私は、ページ上のテーブルがhtml_tableを変更したとしても、まだそれを解析できたはずであると考えていませんか?私はその期間中のページの変更をチェックし、彼らは副次的な編集でした。 – ANCutler