私はいくつかのURLをループする方法を理解しようとしています。これは単なる学習課題です。私は基本的にこれを行う方法を知っていると思っていましたが、今は数時間問題に悩まされています。この時点では何の進歩もありません。私は以下の私のコードは近いと信じていますが、それは何らかの理由で何かを掻き立てているわけではありません。いくつかのURLを実行し、それぞれからデータをインポートします
library(rvest)
URL <- "https://www.ebay.com/sch/i.html?_from=R40&_sacat=0&_nkw=mens%27s+shoes+size+11&rt=nc"
WS <- read_html(URL)
URLs <- WS %>% html_nodes("ResultSetItems") %>% html_attr("href") %>% as.character()
は基本的に、私は、eBayに行き、簡単な検索語を入力し、「ResultSetItems」という名前のキーのノードを、発見し、そこからアイテムをこすりしようとしました。何も起こらなかった。また、私はどのように5つのURLを言うと、同じロジックを適用してインクリメントする方法を把握しようとしています。 URLは次のようになります。私はこの作業を取得することができないよう
for(i in 1:5)
{
site <- paste("https://www.ebay.com/sch/i.html?_from=R40&_sacat=0&_nkw=mens%27s+shoes+size+11&_pgn=",i,"&_skc=0&rt=nc", jump, sep="")
dfList <- lapply(site, function(i) {
WS <- read_html(i)
URLs <- WS %>% html_nodes("ResultSetItems") %>% html_attr("href") %>% as.character()
})
}
finaldf <- do.call(rbind, webpage)
:
'https://www.ebay.com/sch/i.html?_from=R40&_sacat=0&_nkw=mens%27s+shoes+size+11&_pgn=1&_skc=0&rt=nc'
'https://www.ebay.com/sch/i.html?_from=R40&_sacat=0&_nkw=mens%27s+shoes+size+11&_pgn=2&_skc=0&rt=nc'
'https://www.ebay.com/sch/i.html?_from=R40&_sacat=0&_nkw=mens%27s+shoes+size+11&_pgn=3&_skc=0&rt=nc'
'https://www.ebay.com/sch/i.html?_from=R40&_sacat=0&_nkw=mens%27s+shoes+size+11&_pgn=4&_skc=0&rt=nc'
'https://www.ebay.com/sch/i.html?_from=R40&_sacat=0&_nkw=mens%27s+shoes+size+11&_pgn=5&_skc=0&rt=nc'
私は、コードは次のようになりべきだと思います。私は物事を過度に単純化するかもしれない。わからない。ここで少し助けてもらえますか? TIA。
申し訳ありませんが、どういう意味ですか?あなたのコードは実際に何もしません。私はあなたが何を意味するかを知っています...私は必ずしもスクリーンスクラップebayリンクをしたくないです。私は私が知っていると思ったコンセプトを学びたいと思っていますが、私が今見ているように、私はこのことがどのように機能するのか本当に分かりません。ありがとう。 – ryguy72
答えがより正確な例を提供するように編集されました。幸せなウェブスクレイピング:) –
AWESOME !!これを共有してくれてありがとう! – ryguy72