Raspberri PiのScrapyを使用して、最初の読み込み後にjavascriptで変更されたページをスクラップしようとしています。Rasbperry PiのスクラップとJavascriptサイト
私はドッカーとscrapinghub/splashをインストールして、ページをレンダリングする前にレンダリングしようとしましたが、SplashはまだARMをサポートしていません。ラズベリーパイのScrapyでjavascriptを使用してページをスクラップする他のオプションはありますか?
現在のところ、サイトの通常の治療リクエストを使用して、私はこのhtmlを取得します。これは、サイトが最初に読み込まれ、次にjavascriptがコンテンツ全体をレンダリングするためです。だから、前ページのソースが空になりますジャバスクリプト:これは移動するための方法、されていないhttps://www.sreality.cz/hledani/prodej/byty?region=brno
https://github.com/voliveirajr/seleniumcrawler/blob/master/seleniumcrawler/spiders/seleniumcrawler_spider.pyで議論されているアプローチを試すことができます。 rasbperry piにPhantomJSブラウザを使用してください。 –