私は、複数のシートからデータを検索するためのWebスクレイピングプログラムを開発中です。以下のコードは私が働いているものの例です。私はこれについて最初のシートだけを得ることができます。私の構文でどこが間違っているかを誰かが指摘できるなら、大きな助けになるでしょう。以下はRを使用して複数のリンクを掻くR
jump <- seq(1, 10, by = 1)
site <- paste0("https://stackoverflow.com/search?page=",jump,"&tab=Relevance&q=%5bazure%5d%20free%20tier")
dflist <- lapply(site, function(i) {
webpage <- read_html(i)
draft_table <- html_nodes(webpage,'.excerpt')
draft <- html_text(draft_table)
})
finaldf <- do.call(cbind, dflist)
finaldf_10<-data.frame(finaldf)
View(finaldf_10)
私は 127ページを持っているデータをこすりする必要がある場所からのリンクです。
[https://stackoverflow.com/search?q=%5Bazure%5D+free+tier][1]
私は最初のページだけではなく、ページの残りの部分からデータを取得することができています上記のコードを1として。構文エラーもありません。私が間違っている場所を見つけるのを手伝ってください。
は、あなたの代わりに '' do.callのdo.call(rbind、dflistを) 'を使用する必要はありません。 (cbind、dflist) '?さらに、何が起こっているのかの説明を(あなたに合わせて)含め、エラーメッセージや誤った出力を含めることは常に良いことです。 – Jaap
同様の問題の例:https://stackoverflow.com/questions/40525661/how-to-scrape-mutiple-tables-indexing-both-yearpage – Jaap
@Jaapの問題はdflistループにあります – Tanuvi