私は特定のウェブサイト上のすべてのテーブルを掻き集める方法を探しています。テーブルはすべてのサブページで全く同じにフォーマットされています。問題は、これらのサブページのURLがこのようになっていることです。
url1 = 'http .../Tom'、
url2 = 'http .../Mary'、
url3 = 'http .../Jason 'のように、URLを徐々に変更してループを設定することはできません。パンダでこれを解決する方法はありますか?パンダを使用して複数のWebページでhtmlテーブルをスクラップすることはできますか?
答えて
もう一つのアイデアは、最初のBeautifulSoup
ライブラリを使用してWebページからすべてのtable
の要素を取得し、その後、私は、各ページ内のデータが実際にHTML table
要素としてフォーマットされていることを前提としています、とすることができpd.read_html()
適用するのだろうパンダによって処理されます。
df = pd.read_html(url, header=0)[0]
またはこの:;(。テーブルはHTML table
要素ではないように見えるもちろん、多くのページが表示され、それをチェックすることにもある)
そして、一つのテーブルを処理するコードは、この本を見えるかもしれません。
df = pd.read_html(url)[0]
私は各ページに関心のあるテーブルが1つだけあると仮定しています。実際には、read_html
という他のパラメータを変更する必要があるかもしれません。
stub_url = 'http:// ...'
dfs = []
for ending in ['Tom', 'Mary', 'Jason']:
one_df = pd.read_html(stub_url + ending, header=0)[0]
dfs[ending] = one_df
それを感謝します。残念ながら、私はあなたのコードに従っていますが、それは以下のように戻ります:リストインデックスは、strではなく整数またはスライスでなければなりません。 –
申し訳ありません、今すぐお試しください。 –
- 1. 複数のHTMLタグを持つWebページをスクラップできません
- 2. BeautifulSoup - ページから複数のテーブルをスクラップ?
- 3. 美しいスープでhtmlテーブルをスクラップしてパンダに
- 4. 複数のHTMLページでソケットを使用できますか?
- 5. beautifulsoupとpythonを使用して複数のページでサイトをスクラップする方法はありますか?
- 6. 私は、Webでhtmlページのbody要素をPythonでスクラップすることができません
- 7. PHPを使用してWebページをスクラップする方法は?
- 8. Pythonを使用してjsp Webページのコンテンツをスクラップする
- 9. Google Web Appの使用 - 同じWebアプリケーション内のあるHTMLページから別のHTMLページに変数を渡すことはできますか?
- 10. Node.jsを使用してリアルタイムでWebページをスクラップ
- 11. Scrapyを使用して複数のページをスクラップする方法は?
- 12. HTMLテーブルでrowspanを1.5として使用できますか?
- 13. 複数のページをループしてデータをスクラップすることができません
- 14. 複数の入力を持つPythonでWebページをスクラップ
- 15. PHPはhtmlページをスクラップします
- 16. WebページのコアテキストをPythonでスクラップする
- 17. Pythonを使用してWebページから広告をスクラップ
- 18. Web複数のページを直列でスクラップR
- 19. CSS SelectorとBeautifulSoupを使用してテーブルからデータをスクラップするには?このページ
- 20. カスタムHTMLフォームを使用して、複数のフォームフィールドをGoogleフォームに送信することはできますか?
- 21. Herokuを使用してデータをスクラップして後でダウンロードすることはできますか?
- 22. MySQL:SELECT ... FOR UPDATEを使用して、複数のテーブルを「保護する」ことはできますか? (LOCKING)
- 23. SSRS:同じデータセットを使用して複数のテーブルを表示することはできますか?
- 24. Javascript拡張子でノードjsを使用してWebページをスクラップする
- 25. パンダのgroupby()を使用すると、一度に複数の機能を得ることができますか?
- 26. WebページでJavaScriptを使用してオーディオエンジンであるfmodを呼び出すことはできますか?
- 27. のHTMLページでは、jspコードを使用することができます
- 28. PHPを使用して海外のWebページでJavaScriptを実行することはできますか?
- 29. R:URLに複数のテーブルをスクラップする
- 30. rvestを使用してコンテンツをスクラップすることができません
あなたがたURLがどうなるか事前に知っていますか:
その後、完全なコードは次のようなものでしょうか?あなたはどこにURLを取得していますか? – jarcobi889
スクラップで 'pandas'をどうやって使いますか? –
pd.read_html()メソッドの使用を試みることはできますが、ページの例がなくても何かを具体的に示唆することは難しいです。だから、あなたは例を挙げることができますか? – omdv