2016-03-16 16 views
5

httpsウェブサイトをスクラップしたいが失敗した。ここでウェブスクレイピング用のパッケージ「rvest」プロキシを使用したhttpsサイト

は私のコードです:

require(rvest) 
url <- "https://www.sunnyplayer.com/de/" 
content <- read_html(url) 

しかし、私はコンソール - 「open.connectionでのエラー(X、 『RB』)にエラーがあります:タイムアウトに達した」私はこの問題を解決することができます 方法は?

+0

そのコードはエラーなしで実行されます。この問題はプロキシに固有の問題かもしれません。 –

+0

プロキシ用にRで必要な設定は何ですか? plzは私を助けます。 –

+0

私はそれがプロキシなしで私のために働いたことを知っています。あなたのタイトルはあなたがプロキシを使用していると述べているので、それがセットアップと私の間の唯一の違いなら、それは問題でなければなりません。 –

答えて

7

プロキシで同じことが起こります。この問題を回避するには、download.fileを使用してダウンロード場所を指定します。 read_htmlを使用してファイルを解析できます。

download.file(url, destfile = 'C://whatever.html') 
content <- read_html('C://whatever.html') 
関連する問題