問題:rvestを使用して、私が必要とする情報のブロックを、ファントムjsでレンダリングしたHTMLページから見つけることができないようです。ほぼすべてのフォーマットを試しましたが、html_nodeを取得して正しいブロックを取得できないようです。ファントムをHTMLをRにレンダリングする
ファントムからレンダリングされたHTML:私は完全に希望のコードブロックをしないのです車ベクトルを検査するとき、私は、しかし、R
library(rvest)
library(stringr)
library(plyr)
library(dplyr)
library(ggvis)
library(knitr)
library(tidyverse)
cars <- read_html("my file.html") %>%
html_nodes("div") %>%
html_text()
でやっていること
<div class="page">
<div class="main-header">
</script>
<div id="listing-703036966" class="shop-srp-listings__listing">
<div class="card listing-row--search hide-fade">
<div class="listing-row__main">
<div class="listing-row__image">
<div class="media-count shadowed">
<a href="/vehicledetail/detail/703036966/overview/" target="_self" class="media-count--photo" data-goto-vdp="703036966" data-standard-link="md-thumb">
25 Photos
</a>
<a href="/vehicledetail/detail/703036966/overview/" target="_self" class="media-count--video" data-goto-vdp="703036966" data-standard-link="md-thumb">
1 Video
</a>
</div>
<a href="/vehicledetail/detail/703036966/overview/" target="_self" class="gray-bg listing-row__photo" data-goto-vdp="703036966" data-standard-link="md-thumb">
<img alt="New 2018 BMW 750 i" src="https://www.cstatic-images.com/phototab/e/1/4/e2/f87fb57ec51cab4f57cbaeb9f9f.jpg" onload="window.performance.mark('serverSideFirstPhotoLoaded')">
</a>
<div class="compare-srp">
<div class="listing-row__save">
<a id="703036966" class="switch-favorite unsaved saveVehicleHeart compare-switch-favorite" savedfeatureinstance="" vehicle="{"listingId":703036966,"mkId":20005,"mkNm":"BMW","mdId":20536,"mdNm":"750","trimId":25905,"trimName":"i","modelYearId":35797618,"modelYear":2018,"stkTyp":"New","state":"NC","zipcode":"27107"}" cars-common-omniture-custom="" omniture-events="">
<div class="save-icon-wrapper">
<div class="cui-icon icon-heart-line">
<svg width="16" height="16" class="icon-image">
<use xlink:href="#cui-icon-heart-outline"></use>
</svg>
</div>
<div class="cui-icon icon-heart">
<svg width="16" height="16" class="icon-image">
<use xlink:href="#cui-icon-heart-fill"></use>
</svg>
</div>
</div>
<p class="saved-label">Save</p>
</a>
</div>
<div class="compare-button" data-compare-listing="703036966">
<div class="compare-icon-wrapper">
<div class="cui-icon icon-plus-sign">
<svg width="16" height="16" class="icon-plus-sign">
<use xlink:href="#cui-icon-plus-sign"></use>
</svg>
</div>
<div class="cui-icon icon-checkmark">
<svg width="16" height="16" class="icon-checkmark">
<use xlink:href="#cui-icon-checkmark"></use>
</svg>
</div>
</div>
<p class="compare-button__label compare">Compare</p>
<p class="compare-button__label added">Added</p>
</div>
</div>
</div>
など
これは:
<a id="703036966" class="switch-favorite unsaved saveVehicleHeart compare-switch-favorite" savedfeatureinstance="" vehicle=". {"listingId":703036966,"mkId":20005,"mkNm":"BMW","mdId":20536,"mdNm":"750","trimId":25905,"trimName":"i","modelYearId":35797618,"modelYear":2018,"stkTyp":"New","state":"NC","zipcode":"27107"}" cars-common-omniture-custom="" omniture-events="">
しかし、それは決して使用可能な形式に変換されず、私が試してみるさまざまなノード(div、p、span)を失います。
アイデア?
"フルHTML"とは、投稿したもの、または複数の車の投稿を含むさらに大きなHTMLを指していますか? –
私はそれを考え出しました.html_nodeとhtml_nodes。再度、感謝します!応答は完璧です – MDEWITT
ありがとうございます。それが助けてくれてうれしい。 –