私はrとseleniumにはかなり新しく、うまくいけば自分のことを明確に表現することができます。 ウェブサイト(.aspx)からデータを掻き出し、次のページの情報を引き出すために化学コードを入力する必要があります(R-seleniumを使用して要素を入力してください)。これまでのところ私は最初のステップを踏まえた短いコードを作ることができました。つまり、私が望む正しいページを引き出すことができました。しかし、私はこのウェブサイトからデータ(テーブルの化学情報)を掻き集める良い方法を見つけることに非常に苦労しました。主に、ウェブサイトが新しい化学物質の検索に同じaspxアドレスを与える代わりに、新しいhtmlアドレスを割り当てないためです。私はこれを克服してループを構築して、より多くの情報を自動的に掻き集めることができます。誰もが、クリック要素の後にデータを取り除く方法を知っていますか? 2ページ目に化学情報テーブルが必要です。 事前にヒープをお寄せください!R-Seleniumを使用してaspxウェブページのデータを削る
ここで私はこれまでに書いたコードを書いています。次のステップは、次のページからテーブルを掻き取ることです。
library("RSelenium")
checkForServer()
startServer()
mybrowser <- remoteDriver()
mybrowser$open()
mybrowser$navigate("http://limitvalue.ifa.dguv.de/")
mybrowser$findElement(using = 'css selector', "#Tbox_cas")
wxbox <- mybrowser$findElement(using = 'css selector', "#Tbox_cas")
wxbox$sendKeysToElement(list("64-19-7"))
wxbutton <- mybrowser$findElement(using = 'css selector', "#Butsearch")
wxbutton$clickElement()