はい、私は同様の質問があることを知っています、私は答えを読んで、私が実装できるものを試しました。だから、質問がばかげている場合は、事前にお詫び申し上げます:)rutとruterのデータスクラップ、見つけたCSSセレクタ
私は企業のリストについては、ロイターから会社の役員の年齢を削っています。 リンク:http://www.reuters.com/finance/stocks/companyOfficers?symbol=MSFT
適切なCSSセレクタを見つけるためにrvestライブラリとselectorgadgetを使用しています。
library(rvest)
d = read_html("http://www.reuters.com/finance/stocks/companyOfficers?symbol=GAZP.RTS")
d %>% html_nodes("#companyNews:nth-child(1) td:nth-child(2)") %>% html_text()
結果は私が間違っているCSSセレクタを持っていると思う
character(0)
です: ここではコードです。テーブルを選択する方法を教えていただけますか?あなたがデータを取得するためにhtml_session
を使用する必要が
を_」あなたは、削除、変更、転送、こすり、コピー、販売、配布、再送信、派生物を作成するか、またはそうでなければ利用できるようにしない場合があります私たちの事前の書面による同意なしに第三者に提供するコンテンツ " - あなたが別途書類を提出することができない限り、あなた自身の啓蒙のためにこれをやっていることはまずありません。 – hrbrmstr
私は自分の論文(ボードエクスペリエンス〜企業パフォーマンス)のためにこれをやっています。したがって、私は第三者にコンテンツを提供することはできません。それでも、この点に感謝します。私は、この目的のために集計されたデータを使用できるかどうか尋ねます。私は自分の組織が自分のサービスに加入しているので、自分自身でこのデータを使用できるとも信じています。 – Petr