rvestはスクレイプされたテーブルからヘッダのみを返します

以下は、rvestを使用してスクレイプされた目的のテーブルからのヘッダのみを返します。rvestはスクレイプされたテーブルからヘッダのみを返します

library(rvest) 

url <-("https://www.baseball-reference.com/draft/?year_ID=2017&draft_round=1&draft_type=junreg&query_type=year_round&from_type_jc=0&from_type_hs=0&from_type_4y=0&from_type_unk=0") 

draft <- read_html(url) 

draft_first_html <- html_nodes(draft,xpath = '//*[@id="div_draft_stats"]')

私は運がないいくつかの異なるxpathsを試しました。 36の観測値と24の変数が返されます。

出典

2017-12-03 Corey Turner

'read_htmlは（）'私のためにHTTP 400エラーがスローされます。 – Mako212

URLにエラーがありました（ 'jc'の後ろのスペース） - 私はそれを編集しました。 – neilfws

これはあなたのURLを修正した後、私の作品：

draft <- read_html(url) 
draft %>% 
    html_node("#draft_stats") %>% 
    html_table()

出典

2017-12-04 00:04:40 neilfws

rvestはスクレイプされたテーブルからヘッダのみを返します

答えて

関連する問題