0
私はhereからリンクを抽出しようとしています。記事の見出しと各リンクの簡単な要約があります。 出力には、記事の見出しと、同じページにある各記事の概要が含まれている必要があります。見出しと要約を含むRのWebクローラー
リンクを取得できます。あなたはどのように私は各リンクの見出しと要約を得ることができます示唆してください。以下の私のコードを見てください。
install.packages('rvest')
#Loading the rvest package
library('rvest')
library(xml2)
#Specifying the url for desired website to be scrapped
url <- 'http://money.howstuffworks.com/business-profiles.htm'
webpage <- read_html(url)
pg <- read_html(url)
head(html_attr(html_nodes(pg, "a"), "href"))
ありがとうございました。私の無知をご容赦ください。このエラーが発生しましたloadNamespace(name)のエラー: 'dplyr'というパッケージがありません > head(articles) head(articles)のエラー:オブジェクト 'articles'が見つかりません – alyoung3344
@ alyoung3344インストールが必要なようですおよび/または負荷dplyr。 'install.packages(" dplyr ");ライブラリ(dplyr) ' – RobertMc