私はPythonを使用してウェブサイトからコンテンツを拝借しています。最初にBeautifulSoup
とMechanize
をPythonで使用しましたが、JavaScriptを使用してコンテンツを作成したボタンがウェブサイトにあることがわかりましたので、Selenium
を使用することにしました。Selenium vs. BeautifulSoup Webスクレイピング
driver.find_element_by_xpath
のような方法でSeleniumを使用して要素を見つけ出すことができるとすれば、私はちょうどSeleniumをすべて使用できるのですが、どのような理由でBeautifulSoup
を使用するのですか?
この特別なケースでは、JavaScriptボタンをクリックするためにSeleniumを使用する必要があるため、Seleniumを使用して解析する方が良いか、SeleniumとBeautiful Soupの両方を使用する必要がありますか?
私は以前にHTMLの解析にSeleniumを使用したことはありませんが、BeautifulSoupはかなり堅牢です。つまり、すでに何かのためにSeleniumを使用しているので、何か他のものが必要な理由が分かるまで、両方を使用してみませんか? – crowder
@crowderはい私はSeleniumですべてをやっている瞬間ですが、私はBSを使いましたので、本当に最高のものを知りたいと思います。構文解析に関しては、例と同じように、Seleniumにはdriver.find_elements_by_class_name( "...")があり、BSにはsoup.findAll( '...'、{'class' : '....'})。 BSは少しゆっくりですが、どう思いますか? – elie
@elie:これは本当にあなたが達成しようとしていることです。 SeleniumはWeb UIオートメーションツールとして設計されていますが、htmlを解析したいだけなら余計です。ページとのやりとりが必要な場合は、Seleniumを使用してください。ありがとうございます。 –