私はBeautifulSoupを使用してウェブサイトをスクラップするのに慣れていますが、このウェブサイトは異なります。 soup.prettify()にJavascriptコード、たくさんのものが戻ってきます。私は実際のウェブサイト(会社名、電話番号など)のデータをこのウェブサイトで削っていきたいです。 Main.jsなどのスクリプトをスクラップして、Webサイトに表示されるデータを取得する方法はありますか?WebスクレイピングJavascript Pythonを使用して
クリアバージョン:
コードは次のとおりです。
<script src="/docs/Main.js" type="text/javascript" language="javascript"></script>
これは、ウェブサイト上にあるテキストを保持しています。私はこのテキストを傷つけたいと思っていますが、HTMLではなくJSを使用しています(私はBeautifulSoupを使用していました)。
あなたは何をしようとしているのかもっと明確にしてください。 –
[Web-scraping JavaScript page with Python](http://stackoverflow.com/questions/8049520/web-scraping-javascript-page-with-python) –
@ AlexanderO'Mara申し訳ありません、更新しました –