2016-08-19 12 views
2

ここで私はRの完全な初心者です。私はrvestとWebから掻き出す方法についてもっと学びたいと思っています。ここでは、以下のwikiページ(https://en.wikipedia.org/wiki/Andy_Murray)とは、私はCSSセレクタを使用したR.WennisのテニステーブルでRvestを使用したWeb Scraping

table that i want

に転送したい表されている、私は特定のテーブルには、「.wikitable」であることがわかりました。他のウェブページ上のいくつかのチュートリアルに続き、ここで私が使用したコードは次のとおりです。

library(rvest) 
tennis <- read_html("https://en.wikipedia.org/wiki/Andy_Murray") 
trial <- tennis %>% html_nodes(".wikitable") %>% html_table(fill = T) 
trial 

私は私が望んでいたテーブルに結果を分離することができませんでした。誰かが私に教えてくれますか?もう一つのことは、パイプは何をしますか(%>%)?

答えて

3

あなたはほとんどそこにいました。あなたが抽出したものはリストでした。

trial[[2]] 

はそれをさらに使用をきれいにするには:ご希望の要素を取得するには、インデックスを使用する必要が

df <- trial[[2]] 
df <- df[-1,] 
df[,17:20] <- NULL 

enter image description here

%>%がmagrittr/dplyrパッケージからのパイプと呼ばれています。詳細情報here

関連する問題