5
私は、侵入した植物種の場所のデータを、rvestパッケージを使用してCABI invasive species compendiumから抽出しようとしています。htmlテーブルからのデータの掻き取り
いくつかのチュートリアルを見てきましたが、私はテーブルからデータを簡単に取り出すことができるはずだと考えました。しかし、私は苦労し続けています。
私が種の位置データを求めたいとしましょうBrassica tournefortii。種を記録した場所の詳細を入手するには、技術outlined hereを使用するこのコードを使用できるはずです。
library(rvest)
isc<-read_html("http://www.cabi.org/isc/datasheet/50069")
isc %>%
html_node("#toDistributionTable td:nth-child(1)") %>%
html_text()
しかし、私はウェブスクレイピングに完全に新しいですエラー
Error: No matches
を取得し、このコードを実行しています。恐ろしいことをしていますか?
素晴らしいです、ありがとう!それは私がそのサイトからデータを取得するのに良いスタートをするのを助けるはずです。どのように情報をxml_find_all関数のxpath部分に入れるのですか? –
右クリックし、そのテーブルの要素の検査を選択した後、開発者ツールに表示されたパスからマップしました。私はCSSでそれをやり直すことができるかもしれませんが、少しのXPathがいくつかの状況で役立つことがわかっています。 – hrbrmstr