2016-10-25 13 views
0

小さな質問ですが、私はそれがグーグルに基づいた複製ではないと思います。Reriaを使ったAria Table Columnからの掻き出し

私はテーブルのセットからデータを削り取ろうとしています。 「NAME」http://www.votewatch.eu/en/term8-thailand-notably-the-case-of-andy-hall-joint-motion-for-resolution-paragraph-11-amendment-1.html

私は

library(rvest) 
library(magrittr) 
url <- "http://www.votewatch.eu/en/term8-thailand-notably-the-case-of-andy-hall-joint-motion-for-resolution-paragraph-11-amendment-1.html" 
read <- read_html(url) 
nodes <- read %>% html_nodes("td.sorting_1 > a") #based on copy/paste CSS selector 

を使用しますが、私は何を抽出することはできません、そこから長さが0のノードを取得しようとしています。私もセレクタガジェットを使用してみましたが、まだテーブルの何かを得ることができませんでした。

どのような考えですか?おかげで、

答えて

0

ページにはログインが必要なためです...

enter image description here

あなたはこれをこすりがはるかに困難になるだろうRseleniumを見て...最初に認証する必要があります。

+0

ブラウザにログインしていると(たとえば)、その上にあるテーブルから引き続き削除できます。日付の場合: 'url < - " http://www.votewatch.eu/en/term8-2026-un-climate-change-conference-in-marrakesh-morocco-coop22-motion-for-resolution-vote -resolution.html " リード< - read_html(URL) <- read %>ノード%のhtml_nodes(" body> div.normal_page> div.content_all_page> div.container.content> DIV> div.width_60_percent.vote_facts.floatleft> DIV> セレンについては、私が持っているものはすべて現時点で古いノートパソコンですので、特権を与えることはできません –

+0

「RSelenium」では管理者特権は必要ありません私の経験では、それはリソースを大量に消費するものではありません。 [このチュートリアル](http://zevross.com/blog/2015/05/19/scrape-website-data-with-the-new-r-package-rvest/)は、 'rvest'と' RSelenium ' – OdeToMyFiddle

関連する問題