2017-12-11 5 views
1

私は文字列解析を解明しようとしてきましたが、頭の中にいるようです。この中で(私は種の名前がここで起こることを発見したeBirdウェブサイトの文字列解析

url <- 'http://ebird.org/ebird/country/CR?yr=all' 
doc <- htmlParse(rawToChar(GET(url)$content)) 
string <- as(doc, "character") 

:私はこのようなもので持って、私の最終製品は、これまでのところthis webpage. から「種名」列の文字ベクトルになりたいですケース、シロハラストーム-フルマカモメ):

<td headers="s" class="species-name">White-bellied Storm-Petrel</td> 

どのように私はこれらのすべてを引くと、リストにそれらを収集することができるかもしれませんか?

答えて

1

私たちは、これは完璧ですrvest

library(rvest) 
species <- read_html(url) %>% 
       html_nodes('td.species-name') %>% 
       html_text 
head(species) 
#[1] "Common Pauraque"   "Roadside Hawk"    "Inca Dove" 
#[4] "Common Ground-Dove"  "White-winged Dove"   
#[6] "Rufous-tailed Hummingbird" 
+1

でこれを行うことができます!ありがとうございました! – Heliornis