返信を使用してスパンコンテンツを取得する

rvestパッケージを使用して一連のウェブページをスクラップしようとしています。 Webページのコンテンツを取得するときに機能しますが、1階の作成時間を取得することはできません。2017-08-17 01:47このWebページは作成しません。返信を使用してスパンコンテンツを取得する

url <- read_html("http://tieba.baidu.com/p/5275787419", encoding = "UTF-8") 
# This works 
contents <- url %>% html_nodes(".d_post_content_firstfloor .clearfix") %>% html_text() 
# This doesn't work 
create_time <- url %>% html_nodes(".d_post_content_firstfloor li+ li span") %>% html_text() 
create_time 
character(0)

ウェブ上で1階の時間を取得したいと思いますが、アクセスする方法がわかりません。これは

create_time<- url %>% html_nodes(xpath= '//*[@id="j_p_postlist"]/div[1]') %>% xml_attr("data-field") 
gsub(".*date\\\":\\\"(.*)\\\",\\\"vote_crypt.*","\\1",create_time)

出力することができ達成する

出典

2017-08-28 Dong Yuan

一つの方法は次のとおりです。

[1] "2017-08-17 01:47"

は、この情報がお役に立てば幸い！

出典

2017-08-28 11:22:17 Prem

どうもありがとうございます！！！ –

助けてくれてうれしい！ btwなぜそれを「正解」としてマークしないのですか？ :) – Prem

と表示されています！スタックオーバーフローで質問するのは初めてです〜助けてくれてありがとう！ –

返信を使用してスパンコンテンツを取得する

答えて

関連する問題