screen-scraping

    22

    3答えて

    は今のところ私は正常これでHTMLページから完全な要素をつかん: <img src="http://example.com/img.jpg" class='photo-large' /> しかし、私は唯一のSRCのURL(http://example.com/img.jpg)が必要です: //img[@class='photo-large'] 例えばそれは、これを返します。どんな助け?

    0

    1答えて

    私はsimplehtmldomを使ってウェブスクレーパーを書こうとしています。私はタグの内容を検索してタグを取得したい。これはその内部の平文であり、タグの種類ではありません。その後、プレーンテキストの内容を検索してタグを取得すると、その次のタグを取得します。 タグの内容に基づいてタグを見つけるにはどうすればよいですか?そして一度それがあると、次のタグを見つけるにはどうすればよいですか? お願いしま

    0

    3答えて

    ウェブスクレーパーを作成しようとしています。私はすべての細胞を一列にしたい。私が望む前の行は、プレーンテキスト値として会議を盛り上げています。私はうまくこの行を得ることができます。しかし、私はセルまたは<td>タグである次の行の子供を取得する方法を把握することはできません。ここで if ($foundTag = FindTagByText("THOROUGHBRED MEETINGS", $htm

    3

    4答えて

    私は最近、顧客が保険ビジネスのウェブサイトを構築するように依頼されました。その一環として、プロバイダのプロバイダのために見積もりサイトのスクリーンスクレイピングをいくつか行いたいと考えています。彼らは、これを行うためのAPIであるかどうかを尋ね、1つではないと言われましたが、エンジンからデータを得ることができれば、望み通りに使うことができました。 私の質問:別のサイトへのフォーム送信に対する応答で

    37

    4答えて

    ページに<div class="class1">と<p class="class1">がある場合は、soup.findAll(True, 'class1')の両方で検索されます。 <p class="class1 class2">がある場合、それは見つからないでしょう。特定のクラスを持つすべてのオブジェクトを、他のクラスを持っているかどうかに関係なく、どのように見つけることができますか?

    0

    3答えて

    UNのaspxページを使用して表示されるオンラインデータベースからデータを読み取る必要があります。以前はHTML解析を行っていましたが、常にクエリ文字列の値を操作していました。この場合、サイトはasp.netポストバックを使用します。したがって、ボックス1の値をクリックしてからボックス2を表示し、ボックス2の値をクリックしてボタンをクリックして結果を取得します。 どのように私はそのプロセスを自動化

    7

    1答えて

    PIL.Image.grab()は約0.5秒かかります。それは、私の部分に何の処理もせずに、画面からアプリケーションにデータを取得することです。一方、FRAPSは、最大30FPSのスクリーンショットを撮ることができます。私がPythonプログラムから同じことをする方法はありますか?そうでない場合は、Cプログラムはどうですか? (私はそれをPythonプログラムと連携させることができます...)

    3

    10答えて

    スクリーンスクレイピングは便利なツールのように思えます。あなたは他の誰かのサイトに移動し、そのデータを盗むことができます。 しかし、私はこれがどれほど有用であるかに苦労しています。 ほとんどのアプリケーションデータは、Web上であってもそのアプリケーション固有のものです。たとえば、StackOverflowのすべての質問と回答、またはGoogleのすべての結果を(これが可能であると仮定して)削り取

    2

    1答えて

    UIImageを取得してNSData(ファイルに書き込む)として保存する方法を教えてください。そこにいくつかの明白なメソッドがありますか、誰かがコードスニペットを提供することができますか? ありがとうございます! PS。私の次の質問は、おそらく現在の画面イメージをキャプチャするためのコードスニペットです。私が今まで見てきたスニペットは、私が必要とするものに重大な過度の過ちであるようです。

    1

    3答えて

    スタックオーバーフローのスクリーンスクレーパーを作成しています。私が書いているビットは、HTMLをとり、すべての情報をモデルオブジェクトに入れます。私は答えから情報を解析する間に少し気にしました。 問題は、絶対時間を記述するためにStackOverflowが使用する日付形式です。 DateTime.Parseは動作しません。私はDateTime.ParseExactで騙してみましたが、私は成功しま