web-scraping

    3

    2答えて

    私は、ウェブページから別のカテゴリー名を得るためにスクレーパーをPythonで書いていますが、そのページから何かを取り出すことはできません。私はどこが間違っているのか理解できないように真剣に混乱しています。どんな助けも大いに評価されるでしょう。ここで では、ウェブページへのリンクです: <div class="slide_container"> <a href="/offers/furn

    2

    1答えて

    私はpythonでsplinterモジュールを使用しています。私は、要素が可視であるかどうかをページ上にチェックする必要があり、一見すると唯一の方法は検出できないstyle="display: none;"です。 どうすればよいですか?

    0

    2答えて

    SeleniumとPython 3を使ってウェブサイトからファイルをダウンロードしようとしています。これはオーバーレイウィンドウで確認ボタンを押す必要があります。オーバーレイウィンドウはiFrame内にはなく、オーバーレイが表示されたときにHTMLが動的に追加されますが、セレンはxPathでボタンを見つけることができず、NoSuchElementExceptionを返します。 Seleniumがそ

    0

    1答えて

    私はウェブスクラップに初心者です。私は治療のフレームワークを学び始めました。 私はの治療の基本チュートリアルをカバーしました。今、私はthisページをスクラップしようとしています。 thisチュートリアルを1として 、全体のhtmlページを取得するためには、1つのコード以下の記述する必要があります含まれています import scrapy class ClothesSpider(scrapy

    0

    1答えて

    RSeleniumを使用して多数の.xlsファイルをダウンロードしています。ダウンロードリンクをクリックするとポップアップを作成しないように指定するサーバーをセットアップする次のコードを使用して、やや不器用な解決策を得ることができました。しかし、私は第101ファイル(「レポート(100).XLSとして保存)をダウンロードしたら、ダウンロードポップアップがセレンが駆動され、ブラウザに表示されて始まり

    5

    1答えて

    Pythonでスクリプトを記述して、Webページからいくつかの項目を解析しました。私はとにかくそれを働かせることはできません。後のアイテムは、おそらくiframe以内です。私はそれを切り替えようとしましたが、それは何の効果もありません。私はまだTimeoutExceptionを除いて何も得ていません。私がiframeを切り替えようとした行に当たったときです。どのように私はそれを働かせることができま

    -1

    3答えて

    私は空港名のデータを削っています。 は、私は次のコードを使用しますが、私は彼らには2行いないデータを取得する import requests from bs4 import BeautifulSoup url = 'http://www.airlineupdate.com/content_public/codes/airportcodes/airports-by-iata/iata-a.ht

    1

    1答えて

    私は中国のウェブサイトからテーブルを掻き集めるために次のコードを使用します。それはうまく動作します。しかし、リストに保存されている内容は正しく表示されていないようです。 import requests from bs4 import BeautifulSoup import pandas as pd x = requests.get('http://www.sohu.com/a/79780

    0

    2答えて

    これは私のコードです: $post = [ 'iatacode' => 'DME', ]; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, 'http://www.airlinecodes.co.uk/aptcoderes.asp'); curl_setopt($ch, CURLOPT_RETUR

    0

    1答えて

    何らかの理由で、Splashを使用しているときに何らかの要求があったとしても、私は403を持っています。私は間違っている? https://github.com/scrapy-plugins/scrapy-splash後、私はすべての設定を設定する:8050 scrapinghub /スプラッシュ スパイダーコード: SPLASH_URL = 'http://localhost:8050' DO