2016-12-07 8 views
0

各結果サブページのリンクを返すために次のWebページを解析しようとしています。ただし、 'result'ディメンションは空のリストを返します。各結果ページのヘッダーと基礎となるURLを正しく返すためには、どのようにspan句に入れる必要がありますか?クラスタグを使用してHTML Webページを解析するRcurl

多くのありがとうございます。

# load packages 
library(RCulr) 
library(XML) 

# download html 
url = "http://www.sportinglife.com/racing/results" 
http = htmlParse(url) 
result = lapply(http['//span[@class="hdr t2"]'],xmlValue) 

答えて

0

簡単です。 urlのソースコードで "hdr t2"を見ると、spanタグを問い合わせているときにクラス名としてこれを含むタグがh3タグであることがわかります。 "span"を "h3"に置き換えると動作します。これは、私はそれが簡単だと言う私

 # load packages 
    library(RCulr) 
    library(XML) 

    # download html 
    url = "http://www.sportinglife.com/racing/results" 
    http = htmlParse(url) 
    result = lapply(http['//h3[@class="hdr t2"]'],xmlValue) 

のために動作しますが、それは同様に監督するのは簡単です:)

関連する問題