2016-07-19 16 views
0

私はrとseleniumにはかなり新しく、うまくいけば自分のことを明確に表現することができます。 ウェブサイト(.aspx)からデータを掻き出し、次のページの情報を引き出すために化学コードを入力する必要があります(R-seleniumを使用して要素を入力してください)。これまでのところ私は最初のステップを踏まえた短いコードを作ることができました。つまり、私が望む正しいページを引き出すことができました。しかし、私はこのウェブサイトからデータ(テーブルの化学情報)を掻き集める良い方法を見つけることに非常に苦労しました。主に、ウェブサイトが新しい化学物質の検索に同じaspxアドレスを与える代わりに、新しいhtmlアドレスを割り当てないためです。私はこれを克服してループを構築して、より多くの情報を自動的に掻き集めることができます。誰もが、クリック要素の後にデータを取り除く方法を知っていますか? 2ページ目に化学情報テーブルが必要です。 事前にヒープをお寄せください!R-Seleniumを使用してaspxウェブページのデータを削る

ここで私はこれまでに書いたコードを書いています。次のステップは、次のページからテーブルを掻き取ることです。

library("RSelenium") 
checkForServer() 
startServer() 
mybrowser <- remoteDriver() 
mybrowser$open() 
mybrowser$navigate("http://limitvalue.ifa.dguv.de/") 
mybrowser$findElement(using = 'css selector', "#Tbox_cas") 
wxbox <- mybrowser$findElement(using = 'css selector', "#Tbox_cas") 
wxbox$sendKeysToElement(list("64-19-7")) 
wxbutton <- mybrowser$findElement(using = 'css selector', "#Butsearch") 
wxbutton$clickElement() 

答えて

0

まず、ツールの選択肢が間違っています。あなたのケースでhttp://limitvalue.ifa.dguv.de/WebForm_ueliste2.aspxをある

  • 302は、新しいURLにリダイレクトする "恒久的" URLへ

    第二に、あなたのケースで

    1. POST
    2. 新しいURLを取得

    第3に、最終的な出力は何ですか?

    これは実際にどれだけのデータがあるかによって異なります。それ以外の場合は、手動タスクを実行します。

  • 関連する問題