2017-12-03 12 views
0

以下は、rvestを使用してスクレイプされた目的のテーブルからのヘッダのみを返します。rvestはスクレイプされたテーブルからヘッダのみを返します

library(rvest) 

url <-("https://www.baseball-reference.com/draft/?year_ID=2017&draft_round=1&draft_type=junreg&query_type=year_round&from_type_jc=0&from_type_hs=0&from_type_4y=0&from_type_unk=0") 

draft <- read_html(url) 

draft_first_html <- html_nodes(draft,xpath = '//*[@id="div_draft_stats"]') 

私は運がないいくつかの異なるxpathsを試しました。 36の観測値と24の変数が返されます。

+0

'read_htmlは()'私のためにHTTP 400エラーがスローされます。 – Mako212

+0

URLにエラーがありました( 'jc'の後ろのスペース) - 私はそれを編集しました。 – neilfws

答えて

1

これはあなたのURLを修正した後、私の作品:

draft <- read_html(url) 
draft %>% 
    html_node("#draft_stats") %>% 
    html_table() 
関連する問題