screen-scraping

    32

    7答えて

    私は正規表現を使用してPHPでhtmlスクラップを行ってきました。これは動作しますが、結果は厄介で壊れやすくなります。より堅牢なソリューションを提供するパッケージを使用した人はいますか?構成主導型のソリューションが理想的ですが、私は気にしません。

    3

    4答えて

    Webページを取得し、ページからアドレス情報を抽出する必要があります。いくつかは他のものより簡単です。私はこれを行うのを助けるFirefoxのプラグイン、Windowsアプリケーション、またはVB.NETコードを探しています。 理想的には私たちの管理者(ASP.NET/VB.NET)にURLを入力してページをスクラップし、グリッドに入れることができるデータセットを返すウェブページを持っていたいと思

    10

    7答えて

    HTMLで隠された入力フィールドの値を取得したい。私はHTMLの行がフォーマット <input type="hidden" name="fooId" value="**[id is here]**" /> 誰かがPythonでの例を提供することができますが、次の知っていることを考えると、私はfooIdの値を返します。Pythonで正規表現を書きたい <input type="hidden" n

    5

    5答えて

    CMSを構築しています。このサイトはaspxページのユーザーによって構築され管理されますが、HTMLの静的サイトを作成したいと考えています。 私たちが今やっていることは、AspxページのRenderメソッドをオーバーロードし、HTML文字列をファイルに書き込むコードhereが見つかりました。これは1ページでうまくいきますが、CMSの主な点は、作成者がシステム内の何かを編集する前から、最初からサイト