bs4

-2熱

2答えて

import requests from bs4 import BeautifulSoup ''' It's a web crawler working in ebay, collecting every single item data ''' def ebay_spider(max_pages): page = 1 while page <= max_page

-1熱

1答えて

bs4からデータを保存して、利用可能な方法でリクエストしてください

私はあまりにもPythonには新しいですので、愚かな質問のために私を許してください。前もって感謝します。 I有しコードとBS4及び要求にプリントアウト次のデータ（フロート）、（印刷link.find_all（ "ID"）、link.text） X X bの X C Y Y bの Y C Z Z bの ZのC 代わりに、私は好きそれを保存したいと思います： X ABC Y ABC ZのABC とそれ

1熱

1答えて

BS4は、私はこれに類似したHTMファイルを持っている単純なWebスクレイパーをしようとしてクラス

イムでアイテムを見つけますか？私はこれを試しました allaftuibox=soup.find_all_next("div", { "class" : "ui-box-title" }): allaftuibox.find_all("ul") しかし、すべてのシャフトは空です。どこでエラーを作りますか？どのように私はちょうどulを抽出するのですか？誰かが私を助けることができますか？

-1熱

1答えて

相対XPathを持つ要素を取得するにはどうすればよいですか？

私はxmlファイルを持っています。次のようにetreeとしてlxmlでそれを解析した後、私はそのすべてのタグを取得することができます： root = tree.getroot() for e in root.iter(): print e.tag を、出力は次のようなものです： '{http://www.w3.org/1999/xhtml}html' '{http://www.w

1熱

1答えて

Python BS4 with SDMX

私はSDMXファイル（https://www.bundesbank.de/cae/servlet/StatisticDownload?tsId=BBK01.ST0304&its_fileFormat=sdmx&mode=itsのような）で与えられたデータを取得したいと思います。 BeautifulSoupを使用しようとしましたが、タグが表示されないようです。次のコード import urllib2

1熱

3答えて

ImportError：djangoのbs4というモジュールがありません

私はDjangoを学んでいて、私はMacのPyCharmでbs4を使っていました。私もbs4がインストールされているDjangoでPython3を使用しています。しかし、私がプロジェクトを実行すると、下に示すbs4が存在しないというエラーが表示されます。私は多くの方法を試しましたが、動作させることができませんでした。ヘルプ

0熱

1答えて

テキスト<br>の後にbrタグを置き換えた後に消えます

ウェブサイトのデータを掻き集めていて、BeautifulSoup（bs4）を使用して問題が発生しました。私はいくつかの要素のテキストを取得する必要があります、何か（カンマ、スペースなど）で区切られて、テキストが現れる順序で分割することができます。 bs4.element.Tagの text属性は、テキストコンテンツを提供します。問題は、私は、間に<br>があっても、テキストが連結取得しています、で

0熱

1答えて

完全なページソースをSeleniumで表示できない

Chromeで手動でサイトに移動した後にソースHTMLを表示すると、完全なページソースが表示されますが、セレンを介してページソースを読み込むと完全なページソースが得られません。 from bs4 import BeautifulSoup from selenium import webdriver import sys,time driver = webdriver.Chrome(exe