のURLの正しいCSSセレクタを識別します、私は次のスクリプトを得ることができるヘルパーにウェブサイトと感謝からデータを取得しようとしていますRスクリプト
require(httr)
require(rvest)
res <- httr::POST(url = "http://apps.kew.org/wcsp/advsearch.do",
body = list(page = "advancedSearch",
AttachmentExist = "",
family = "",
placeOfPub = "",
genus = "Arctodupontia",
yearPublished = "",
species ="scleroclada",
author = "",
infraRank = "",
infraEpithet = "",
selectedLevel = "cont"),
encode = "form")
pg <- content(res, as="parsed")
lnks <- html_attr(html_node(pg,"td"), "href")
しかし、いくつかのケースでは上記の例のように、何らかの理由でhtml_attrがhtml_nodeで検出されたノード内のurls( "href")を見つけられないため、正しいリンクを取得しません。これまでは、 "td"、 "a.onwardnav"、 ".plantname"などの異なるCSSセレクタを試しましたが、html_attrが正しく処理できるオブジェクトは生成されませんでした。 何かヒント?
ありがとうございます! –