html-parsing

    0

    2答えて

    私はPHP私は分割することができますどのように/デコード/アクセスオブジェクト(キーと値のペア)としてこの文字列を解析を使用して...のような <match id="18" srs="ICC Womens World Cup Qualifier, 2010" mchDesc="BANW vs PMGW" mnum="4th Match"> をHTML文字列を持っているように ....など ar

    1

    1答えて

    私はPython 2.7でスクレイピングスクリプトを作成しようとしています。 リクエストはOKですが、このテーブルを美しいスープで解析しようとすると苦労します。私はたくさん試してみましたが、フォーラムで多くを検索しましたが、これは初めてでした。ここで はコードです: import requests, os from bs4 import BeautifulSoup url='http://f

    2

    2答えて

    誰かが私のカールでこのリンクを解析する必要がありますどのように私の助けてもらえますか? https://www.linkedin.com/in/williamhgates/ そして、これは私のコードです: ちょうどそれを実行し、結果を見て: $url = "https://www.linkedin.com/in/williamhgates/"; $ch = curl_init($url); c

    0

    1答えて

    私は、スクリプト、noscript、およびスタイルタグで構成されたコードのブロックを処理するために、JsoupのparseBodyFragment()とparse()メソッドを使用しています。目的はそれらをきれいにすることではなく、ただselect()に、それらを分析し、出力することです。 select()部分は本当にうまく機能します。 しかし、問題は、src属性のurlパラメータを自動的にエンコ

    1

    1答えて

    私は、任意のWebページのページオブジェクトを、テキストファイル内のpython [data scraping]を使用してエクスポートしようとしています。また、私は要素のハードコードされたセレンのWebドライバの構文を提供しています。 id属性を使用してこれを実現できます。たとえば、私はタイプtextの属性idと入力を持つすべてのWeb要素を を見つけています: from htmldom impo

    0

    1答えて

    back-endからhtml文字列を渡して、リアクションコンポーネントを使用してhtml文字列をリアクションコンポーネントに変換しています。しかし、エラーを取得します。 ./~/entities/maps/entities.json モジュールでエラーが失敗したパース :/Users/PrashantKumarKatariya/teabox_web/teabox_django/static/nod

    1

    2答えて

    APIエンドポイントにDjango REST汎用ビューを使用しています。私のシリアライザのフィールドの1つにManyToMany関係があります。そのフィールドをAPIエンドポイントに表示したいのですが、このエラーが発生しますLists are not currently supported in HTML input.何ができますか? class AlertCreateView(ListCreat

    0

    1答えて

    私はすべてのリンクhttp://example.com/1を解凍し、2 <br><br>タグの後にすべてのリンクを無視したいと思います。ここ <div class="compost"> <br><b><a target="_blank" href="http://example.com/1"><span id="s_index18" class="select_index"></span>tex

    0

    1答えて

    基本的には、異なるアイテムに関する一連のデータを持つウェブサイトがあり、ツリー構造のアイテム(http://www.isoldwhat.com/getcats/fullcategorytree.php)を記述できるようになっています。すべてのカテゴリを分割してJsonファイルにエクスポートしたいと考えています。私が抱えている問題は、各カテゴリを開くには、それをクリックしてリロードする必要があるとい

    0

    1答えて

    jsonファイルを作成しようとしています。ツリー構造からアイテムのすべてのカテゴリのリストを壊し、カテゴリが入れ子になっている順序を維持することができます(http://www.isoldwhat.com/getcats/fullcategorytree.php)。現在、私はすべてのカテゴリを解析するために、次のコードを持っている: #!/usr/bin/env python import s