htmlページを解析しようとすると、NA値を取得できます。したがって、リスト内のデータを含むデータフレームを作成しようとすると、値がないと不可能になります。htmlページを解析してデータフレームを作成する際に、NA値を置き換える方法は?
成功する方法はありますか?
library(rvest)
library(RCurl)
library(XML)
pg <- getURL("https://agences.axa.fr/ile-de-france/paris/paris-19e-75019")
page = htmlTreeParse(pg,useInternal = TRUE,encoding="UTF-8")
unlist(xpathApply(page,'//b[@class="Name"]',xmlValue))
data.frame(noms = unlist(xpathApply(page,'//b[@class="Name"]',xmlValue)),
rue = unlist(xpathApply(page,'//span[@class="street-address"]',xmlValue)))
あなたは 'html_nodes'ではなく' html_node'を使用しているからです。また、ここではRCurlは不要です。 URLを 'read_html'に直接渡すことができます。 – alistaire
@alistaireありがとう、私は最初のものが愚かなものだったので私の質問を変更しました。この質問については、私はすでに同様の質問をしています:http://stackoverflow.com/questions/42588717/how-to-return-na-when-nothing-is-found-in-an-xpath、他の質問に対するあなたの答えに基づいて解決策を見つけることができます。 –
良い質問です。ただし、XMLの読み込みを再現性のために表示する必要があります。 – alistaire