bs4

    -2

    2答えて

    import requests from bs4 import BeautifulSoup ''' It's a web crawler working in ebay, collecting every single item data ''' def ebay_spider(max_pages): page = 1 while page <= max_page

    -1

    1答えて

    私はあまりにもPythonには新しいですので、愚かな質問のために私を許してください。前もって感謝します。 I有しコードとBS4及び要求にプリントアウト次のデータ(フロート)、(印刷link.find_all( "ID")、link.text) X X bの X C Y Y bの Y C Z Z bの ZのC 代わりに、私は好きそれを保存したいと思います: X ABC Y ABC ZのABC とそれ

    1

    1答えて

    イムでアイテムを見つけますか?私はこれを試しました allaftuibox=soup.find_all_next("div", { "class" : "ui-box-title" }): allaftuibox.find_all("ul") しかし、すべてのシャフトは空です。どこでエラーを作りますか?どのように私はちょうどulを抽出するのですか? 誰かが私を助けることができますか?

    -1

    1答えて

    私はxmlファイルを持っています。次のようにetreeとしてlxmlでそれを解析した後、私はそのすべてのタグを取得することができます: root = tree.getroot() for e in root.iter(): print e.tag を、出力は次のようなものです: '{http://www.w3.org/1999/xhtml}html' '{http://www.w

    1

    1答えて

    私はSDMXファイル(https://www.bundesbank.de/cae/servlet/StatisticDownload?tsId=BBK01.ST0304&its_fileFormat=sdmx&mode=itsのような)で与えられたデータを取得したいと思います。 BeautifulSoupを使用しようとしましたが、タグが表示されないようです。次のコード import urllib2

    1

    3答えて

    私はDjangoを学んでいて、私はMacのPyCharmでbs4を使っていました。私もbs4がインストールされているDjangoでPython3を使用しています。 しかし、私がプロジェクトを実行すると、下に示すbs4が存在しないというエラーが表示されます。 私は多くの方法を試しましたが、動作させることができませんでした。ヘルプ

    0

    1答えて

    ウェブサイトのデータを掻き集めていて、BeautifulSoup(bs4)を使用して問題が発生しました。私はいくつかの要素のテキストを取得する必要があります、何か(カンマ、スペースなど)で区切られて、テキストが現れる順序で分割することができます。 bs4.element.Tagの text属性は、テキストコンテンツを提供します。問題は、私は、間に<br>があっても、テキストが連結取得しています、で

    0

    1答えて

    Chromeで手動でサイトに移動した後にソースHTMLを表示すると、完全なページソースが表示されますが、セレンを介してページソースを読み込むと完全なページソースが得られません。 from bs4 import BeautifulSoup from selenium import webdriver import sys,time driver = webdriver.Chrome(exe