私はthis websiteのウェブスクレイピングプロジェクトを行っています。ページが存在する225の数に設定するアーティストは、存在するのでhttps://lsdb.eu/artists/view/225/
ウェブサイトからすべての有効なURLを取得するには?
:私がやりたいものをこの時点で
は、このようなURLからアーティスト名をこすりすることです。ただし、https://lsdb.eu/artists/view/226/
は存在しませんが、存在する226より大きい番号のページがあります。
https://lsdb.eu/artists/view/xxx/
のURLが有効であるかどうかを確認するためにウェブサイトをスクラップする方法はありますか?
スクラップを 'try'の中にラップして、悪いURLをスキップして次のものに移動することができます。代わりに、 'GET(" https://lsdb.eu/artists/view/225/ ")$ status_codeは200(良い)を返すので、' httr :: GET'はサイトの応答へのアクセスを許可します。 https://lsdb.eu/artists/view/226/ ")$ status_code'は404(悪い)を返します – roarkz