screen-scraping

    0

    1答えて

    私はgithubのウェブサイト(https://rushwallet.com/)のAPIを完成させる作業をしています。 私はPHPを使用しており、このURLからウォレットアドレスを取得しようとしています:https://rushwallet.com/#n3GjsndjdCURphhsqJ4mQH7AjiXlGI。 誰でも私を助けることができますか?これまで 私のコードは: $url = "http

    0

    1答えて

    import bs4 from bs4 import BeautifulSoup as soup from urllib.request import urlopen as uReq import requests import re from pyquery import PyQuery as pq from requests.exceptions import RequestExc

    0

    1答えて

    URLのプールをスクラップするには、私はjoblibでセレンを並列処理しています。この文脈で、私は2つの課題に直面しています: 挑戦1は、このプロセスをスピードアップすることです。現時点では、私のコードは、すべてのURL(理想的にはすべてのプロセスの1つになる)のドライバインスタンスを開き、閉じます。 挑戦2はCPU集約的なwhileループを取り除くことですが、空の結果にはcontinue私の理解

    -3

    2答えて

    私はコーディングにはとても新しいので、coinmarketcapからlitecoinの現在の価格をインポートするコードを書こうとしました。しかし、私はそれを動作させることはできません、それは印刷し、空のリスト。 import urllib import re htmlfile = urllib.urlopen('https://coinmarketcap.com/currencies/lit

    0

    1答えて

    対象:http://voorraadmodule.vwe-advertentiemanager.nl/s9376368b43e8fd6a8025bfa284d8e732/e7c2/stock/vehicles/100/ 私はPythonを学ぶために8日間ですが、本当にそれを愛しています。対象のページは自分のスキルをテストするための私の古い雇用者です。私は彼の株式を毎日チェックして、変化する結果を与

    2

    1答えて

    私はpythonでsplinterモジュールを使用しています。私は、要素が可視であるかどうかをページ上にチェックする必要があり、一見すると唯一の方法は検出できないstyle="display: none;"です。 どうすればよいですか?

    0

    2答えて

    私はthis local websiteを掻き取って、 "Númerodo Processo na ORIGEM"フィールドで単純な整数 を検索しようとしていました。現在、次のコードを正常に実行していません。 headers = { 'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8', 'b

    0

    1答えて

    このプロジェクトでは、「ウェブサイト」をスクラップする必要があります。これは、ローカルフォルダのhtmlファイルです。とにかく、私は各学生のオブジェクトのアンカータグのhref値(URL)にこだわっています。私も他のものを掻き集めているので、残りは無視してください。ここで私はこれまで持っているものである:ここでは def self.scrape_index_page(index_url) #res

    0

    1答えて

    以下のコードでは、ユーザーエージェントをphantomJSインスタンスに設定し、印刷してから再度決定するWebサイトをスクラップします。結果は異なります。どうすればいいの?私はまだ明らかな解をthis再現できませんでした。 1)セットONEユーザエージェント serviceDefaults=["--ignore-ssl-errors=yes",] desiredDefaults={

    -1

    1答えて

    。 SublimeText3、私はセレンパッケージをインストールしましたが、それでも動作しません。誰でも私を助けることができますか? ブラウザを開くと思われますが、何もしませんでした。