2017-10-10 10 views
0

以下のウェブサイトからすべてのNPIと詳細を削りたいと思います。 "https://www.pverify.com/npi-lookup-find-npi-number-of-doctors-physicians/"(iframe)の検索結果をウェブでスクラップする

コード:

library("rvest") 
library("xml2") 
url="https://www.pverify.com/npi-lookup-find-npi-number-of-doctors-physicians/" 
webpage<-read_html(url) 
data_html <- html_nodes(webpage,'iframe') 
data_html <-html_table(data_html) 

私は上記のコードをしようとすると、エラーメッセージが "エラー:html_name(X)== "であるテーブルには、" TRUEではありません" 親切に私を助けてNPI番号とその詳細を取得します。

答えて

1

あなたはRseleniumを試すことができます。

このコードは多かれ少なかれこのように見えます。

library(Rselenium) 
library(XML)  

remDr <- remoteDriver(port = 4445L) 
remDr$open() 
remDr$navigate("https://www.pverify.com/npi-lookup-find-npi-number-of-doctors-physicians/") 
h <- htmlParse(remDr$getPageSource()[[1]], encoding = "UTF-8") 
h_table <- html_table(h) 

あなたはhere

+0

remDr <見ることができるドッキングウィンドウのサーバーを作成するには - RSelenium :: remoteDriver(ポート= 4445L) remDr $オープン() remDrの$のナビゲート(「HTTPS://www.pverifyをh < - htmlParse(remDr $ getPageSource()[[1]]、エンコーディング= "UTF-8") h_table < - html_table(h)コードの最初の行が少し変更され、2行目に「checkError(res)のエラー: のエラーが表示されるhttp:// localhost:4445/wd/hubのホストに接続できませんでした。 e Seleniumサーバーが動作しているかどうかを確認してください。 –

+0

linuxを使用していますか?はいの場合は、ターミナルと数字を開きます:サービスドッカーのステータス。あなたのサーバーが動作しているかどうか確認してください。もしあなたが[this](https://cran.r-project.org/web/packages/RSelenium/vignettes/RSelenium-docker.html)を見る必要がなければ –

+0

窓を使っています10 –

関連する問題