R-Seleniumを使用してaspxウェブページのデータを削る

私はrとseleniumにはかなり新しく、うまくいけば自分のことを明確に表現することができます。ウェブサイト（.aspx）からデータを掻き出し、次のページの情報を引き出すために化学コードを入力する必要があります（R-seleniumを使用して要素を入力してください）。これまでのところ私は最初のステップを踏まえた短いコードを作ることができました。つまり、私が望む正しいページを引き出すことができました。しかし、私はこのウェブサイトからデータ（テーブルの化学情報）を掻き集める良い方法を見つけることに非常に苦労しました。主に、ウェブサイトが新しい化学物質の検索に同じaspxアドレスを与える代わりに、新しいhtmlアドレスを割り当てないためです。私はこれを克服してループを構築して、より多くの情報を自動的に掻き集めることができます。誰もが、クリック要素の後にデータを取り除く方法を知っていますか？ 2ページ目に化学情報テーブルが必要です。事前にヒープをお寄せください！R-Seleniumを使用してaspxウェブページのデータを削る

ここで私はこれまでに書いたコードを書いています。次のステップは、次のページからテーブルを掻き取ることです。

library("RSelenium") 
checkForServer() 
startServer() 
mybrowser <- remoteDriver() 
mybrowser$open() 
mybrowser$navigate("http://limitvalue.ifa.dguv.de/") 
mybrowser$findElement(using = 'css selector', "#Tbox_cas") 
wxbox <- mybrowser$findElement(using = 'css selector', "#Tbox_cas") 
wxbox$sendKeysToElement(list("64-19-7")) 
wxbutton <- mybrowser$findElement(using = 'css selector', "#Butsearch") 
wxbutton$clickElement()

出典

2016-07-19 Jian

まず、ツールの選択肢が間違っています。あなたのケースでhttp://limitvalue.ifa.dguv.de/WebForm_ueliste2.aspxをある

302は、新しいURLにリダイレクトする "恒久的" URLへ

第二に、あなたのケースで

POST
新しいURLを取得

第3に、最終的な出力は何ですか？

これは実際にどれだけのデータがあるかによって異なります。それ以外の場合は、手動タスクを実行します。

出典

2016-07-21 11:42:50

R-Seleniumを使用してaspxウェブページのデータを削る

答えて

関連する問題