問題があります。私はウェブサイトから情報を抽出する必要があります:https://www.transfermarkt.co.uk/premier-league/startseite/wettbewerb/GB1クラブの名前、ウェブサイトのアドレス(transfermarktのプロフィール)、チームのプロフィールからスタジアムの名前。これがウェブサイトからのデータ抽出に関する私の最初の連絡です。どんな助けもありがたい。最初に私はそのようなコードを書いた:htmlテーブルをRデータフレームにスクラップ
library(rvest)
theurl <- "https://www.transfermarkt.co.uk/premier-league/startseite/wettbewerb/GB1"
file<-read_html(theurl)
tables<-html_nodes(file, "table")
table1 <- html_table(tables[4], fill = TRUE)
正確に必要なパラメータは? "PREMIER LEAGUE 17/18のクラブ"のテーブル? –
html_nodes(ファイル、 "テーブル")%>%html_nodes(href)を見ることができるならば、それは正規表現の問題です –
私はチームのプロフィールからクラブ、ウェブサイトのクラブとスタジアムの名前でテーブルが必要です。 – Kim