私は、複数のテーブルを持つWebページからテーブルを削り取ろうとしています。私はhttps://www.census.gov/geo/reference/ansi_statetables.htmlから "アメリカとコロンビア特別区のFIPSコード"テーブルを取得したいと思います。私はXML::readHTMLTable()
が行くための正しい方法だと思いますが、私は、私はエラーを取得する次しようとすると:Rテーブルの名前とスクレイプを見つけるR
url = "https://www.census.gov/geo/reference/ansi_statetables.html"
readHTMLTable(url, header = T, stringsAsFactors = F)
named list() Warning message: XML content does not seem to be XML: ' https://www.census.gov/geo/reference/ansi_statetables.html '
を私は関数に任意の表示を与えていないよので、これは、当然のことながら、驚くべきことではありませんのですテーブル私は読んでいます。私は "Inspect"の中でかなり掘り下げてきましたが、もっと正確にする方法については点をつないでいません。ドキュメントやSOで見つけた他の例に似た名前やクラスの表がないようです。思考? rvest
代わりのXML
を使用して
私は 'readHTMLTable(RCurl :: getURL(url)、...)'でそれを得ました。 –