html-parsing

    0

    1答えて

    htmlをクロールするスパイダーを作成したいと思います。私はrequestsとbeautifulsoupを使用しますが、私はbeautifulsoupがページ全体を解析できないことを知りました。代わりに、Beautifulsoupはちょうどその半分を解析します。ここで が私のコードです: import requests from bs4 import BeautifulSoup as bs u

    0

    1答えて

    私は、HTMLページからすべて<td>タグを選び出すためにいくつかのコードを使用しています: $dom = new DOMDocument; $dom->loadHTML($html); foreach ($dom->getElementsByTagName('td') as $node) { $array_data[ ] = $node->nodeValue; } これは私の配列のデ

    1

    1答えて

    は私がgolangを使用して小規模なWebアプリケーションを書かれている空の値を与える 行くのバージョンgo1.7.4のLinux/AMD64 ゴーコード: r.ParseForm() // logic part of log in fmt.Println("username:", r.Form["username"]) fmt.Println("passwor

    0

    2答えて

    のためのHTMLノードをトラバース: PHP DOM traverse HTML nodes and childnode 誰かが親切に私は、このためのソリューションを与えました。以下に示すように しかし、私は実際に解析していたデータは、複数のハイパーリンクタグを持っています <tr> <td>DATA 1</td> <td><a href="12345" target="_top">DATA

    0

    1答えて

    JavaScriptは、私が知り得た任意のページのソースコードを取得できません。しかし、PHPはかなり簡単です。 //get page source code with php <?php url = 'http://www.thesaurus.com/browse/strong?s=t'; $src = file_get_contents($url); ?> PHPはDOMを操作

    3

    1答えて

    私は自分のウェブサイトに旅行アドバイザーウィジェットを埋め込もうとしていました。 Trip Advisorウィジェットのコードは次のとおりです。 <div id="TA_selfserveprop546" class="TA_selfserveprop"> <ul id="VvhCFP8xz" class="TA_links JZ5CKDSmc"> <li id="SBEZiTat" clas

    0

    2答えて

    サッカー用の係数表を 'http://www.flashscore.com/'から抽出しようとしています。ページのソースコードを見ると、id = "fs"のdiv内にそのテーブルがあることがわかります。しかし、私がそのdivを検索すると、BeautifulSoupは何も返しません。私は以下のようにスクリプトを書いた。ここで何が間違っていますか?あなたはデータ(クラスFSとDIV)はajax.Whe

    3

    1答えて

    私はBeautilfulSoupを使いこなしています.JS要素内で特定のjson文字列を取得する方法を探しています。 ここJSです: <script>window.pinball = window.pinball || []; window.pinball.push(['add', {"srp_cleanup":"inactive","book_visit":"inactive","my_vis

    0

    1答えて

    htmlページが2つあるとします。ページ1とページ2 のPage1は <div class="content"> <p></p> <p></p> </div> ようなHTMLが含まれているとPAGE2は今、私はそれがあれば言って、このコードで Document document = Jsoup.connect(url).get(); Elements links = doc

    3

    4答えて

    私はHTMLファイルをGETし、それを変数にjQueryオブジェクトとして割り当てようとしています。無駄に。スタックスニペットでGETリクエストが許可されているかどうかは分かりません。ここでもJSFiddle linkがあります。 var html = '<!DOCTYPE html><html lang="en"><head><title>Template</title></head><body