Ruby、Selenium WebDriver、Nokogiriを使用して、Webページからデータを取得しています。適切なHTMLが読み込まれると、特定のクラスの内容を出力します。例えばボットを使ってブラウザを開いたり、手動でページを操作したり、ボットを使用したりすることは可能ですか?
、
require "selenium-webdriver"
require "nokogiri"
browser = Selenium::WebDriver.for :chrome
browser.get "https://jsfiddle.net"
doc = Nokogiri::HTML.parse(browser.page_source)
doc.css('.aiButton').map(&:text).join(',')
私がこれまで最も難しい部分が正しくロードされた正しいHTMLを取得していることで発見しました。たとえば、私が望むコンテンツはJavaScriptによって隠されているかもしれないし、別のページにあるかもしれない。
Seleniumを使用してページを読み込み、正しいHTMLが表示されるようにページを手動で操作することは可能ですか?次には、完了したコンテンツをボットで印刷することができますか?
短い答えは「はい」です。 SeleniumはGUIでブラウザを開き、スクリプトが完了するまで開いています。 –