2017-12-03 4 views
0

にロードするにはどうすればいいですか?このウェブサイトのテーブルをRに入れようとしています(宿題用です)、ウェブサイトはhttps://www.4icu.org/top-universities-north-america/です。当然、私はこれをやろうとしましたが、これはうまく見えますが、変数 "Institution"の下では説明部分も取っていました。HTMLテーブルの特定のコンテンツをR

library(XML) 
library(RCurl) 
url2017<-getURL("https://www.4icu.org/top-universities-north-america/") 
doc2017<-htmlParse(url2017,encoding="utf-8") 
rank2017<-readHTMLTable(doc2017, header=TRUE, which=1) 

大学名だけでなく、その下に短い紹介文があります。大学名をRに入れるにはどうすればいいですか(名前だけを含むループを作りましたが、うまくいきませんでした)。 yallヘルプありがとうございます。

答えて

0

信頼性の高い方法でXMLを使用したことが一度もありません。面倒です。 rvestを使用し、Selector Gadgetを使用してCSSセレクタを見つける方がはるかに良いです。

library(rvest) 

URL <- "https://www.4icu.org/top-universities-north-america/" 
vec <- read_html(URL) %>% html_nodes(".text-left .lead") %>% html_text() 
head(vec, 3) 
# " Massachusetts Institute of Technology" 
# " Stanford University" 
# " Harvard University" 
+0

ありがとうございました!これはもっとよく見えます。 – timxymo1225

関連する問題