screen-scraping

0熱

1答えて

私はgithubのウェブサイト（https://rushwallet.com/）のAPIを完成させる作業をしています。私はPHPを使用しており、このURLからウォレットアドレスを取得しようとしています：https://rushwallet.com/#n3GjsndjdCURphhsqJ4mQH7AjiXlGI。誰でも私を助けることができますか？これまで私のコードは： $url = "http

0熱

1答えて

きさげスレッド-HREF

import bs4 from bs4 import BeautifulSoup as soup from urllib.request import urlopen as uReq import requests import re from pyquery import PyQuery as pq from requests.exceptions import RequestExc

0熱

1答えて

並列処理中にセレニウムドライバインスタンスを再利用するには？

URLのプールをスクラップするには、私はjoblibでセレンを並列処理しています。この文脈で、私は2つの課題に直面しています：挑戦1は、このプロセスをスピードアップすることです。現時点では、私のコードは、すべてのURL（理想的にはすべてのプロセスの1つになる）のドライバインスタンスを開き、閉じます。挑戦2はCPU集約的なwhileループを取り除くことですが、空の結果にはcontinue私の理解

-3熱

2答えて

私はPythonへのウェブスクレイピングに問題があります

私はコーディングにはとても新しいので、coinmarketcapからlitecoinの現在の価格をインポートするコードを書こうとしました。しかし、私はそれを動作させることはできません、それは印刷し、空のリスト。 import urllib import re htmlfile = urllib.urlopen('https://coinmarketcap.com/currencies/lit

0熱

1答えて

BeautifulSoup、Scraping、タグなしで画像サイズを取得できますか？

対象：http://voorraadmodule.vwe-advertentiemanager.nl/s9376368b43e8fd6a8025bfa284d8e732/e7c2/stock/vehicles/100/ 私はPythonを学ぶために8日間ですが、本当にそれを愛しています。対象のページは自分のスキルをテストするための私の古い雇用者です。私は彼の株式を毎日チェックして、変化する結果を与

2熱

1答えて

Splinter：スタイルで検索

私はpythonでsplinterモジュールを使用しています。私は、要素が可視であるかどうかをページ上にチェックする必要があり、一見すると唯一の方法は検出できないstyle="display: none;"です。どうすればよいですか？

0熱

2答えて

ローカルWebサイトのPythonリクエスト投稿

私はthis local websiteを掻き取って、 "Númerodo Processo na ORIGEM"フィールドで単純な整数を検索しようとしていました。現在、次のコードを正常に実行していません。 headers = { 'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8', 'b

0熱

1答えて

Rubyでのアンカーのhref値の掻き立て

このプロジェクトでは、「ウェブサイト」をスクラップする必要があります。これは、ローカルフォルダのhtmlファイルです。とにかく、私は各学生のオブジェクトのアンカータグのhref値（URL）にこだわっています。私も他のものを掻き集めているので、残りは無視してください。ここで私はこれまで持っているものである：ここでは def self.scrape_index_page(index_url) #res

0熱

1答えて

私はPythonでPhantomJSと同時に2つの異なるユーザエージェントを持っていますか？

以下のコードでは、ユーザーエージェントをphantomJSインスタンスに設定し、印刷してから再度決定するWebサイトをスクラップします。結果は異なります。どうすればいいの？私はまだ明らかな解をthis再現できませんでした。 1）セットONEユーザエージェント serviceDefaults=["--ignore-ssl-errors=yes",] desiredDefaults={

-1熱

1答えて

Pythonのセレンエラー - 起こって何も画像が示すようにwebdriverを

。 SublimeText3、私はセレンパッケージをインストールしましたが、それでも動作しません。誰でも私を助けることができますか？ブラウザを開くと思われますが、何もしませんでした。