html-parsing

0熱

1答えて

htmlをクロールするスパイダーを作成したいと思います。私はrequestsとbeautifulsoupを使用しますが、私はbeautifulsoupがページ全体を解析できないことを知りました。代わりに、Beautifulsoupはちょうどその半分を解析します。ここでが私のコードです： import requests from bs4 import BeautifulSoup as bs u

0熱

1答えて

PHPのDOMトラバースHTMLノードと子ノード

私は、HTMLページからすべて<td>タグを選び出すためにいくつかのコードを使用しています： $dom = new DOMDocument; $dom->loadHTML($html); foreach ($dom->getElementsByTagName('td') as $node) { $array_data[ ] = $node->nodeValue; } これは私の配列のデ

1熱

1答えて

r.Fromは、[ "ユーザー名"]

は私がgolangを使用して小規模なWebアプリケーションを書かれている空の値を与える行くのバージョンgo1.7.4のLinux/AMD64 ゴーコード： r.ParseForm() // logic part of log in fmt.Println("username:", r.Form["username"]) fmt.Println("passwor

0熱

2答えて

PHP DOMは、私はSOの質問を掲示し、ハイパーリンクタグ

のためのHTMLノードをトラバース： PHP DOM traverse HTML nodes and childnode 誰かが親切に私は、このためのソリューションを与えました。以下に示すようにしかし、私は実際に解析していたデータは、複数のハイパーリンクタグを持っています <tr> <td>DATA 1</td> <td><a href="12345" target="_top">DATA

0熱

1答えて

ページのソースをPHPで取得し、JavaScriptを使って操作します。

JavaScriptは、私が知り得た任意のページのソースコードを取得できません。しかし、PHPはかなり簡単です。 //get page source code with php <?php url = 'http://www.thesaurus.com/browse/strong?s=t'; $src = file_get_contents($url); ?> PHPはDOMを操作

3熱

1答えて

トリップアドバイザーウィジェットが自分のサイトで機能していません

私は自分のウェブサイトに旅行アドバイザーウィジェットを埋め込もうとしていました。 Trip Advisorウィジェットのコードは次のとおりです。 <div id="TA_selfserveprop546" class="TA_selfserveprop"> <ul id="VvhCFP8xz" class="TA_links JZ5CKDSmc"> <li id="SBEZiTat" clas

0熱

2答えて

美味しいスープ4 HTML解析

サッカー用の係数表を 'http://www.flashscore.com/'から抽出しようとしています。ページのソースコードを見ると、id = "fs"のdiv内にそのテーブルがあることがわかります。しかし、私がそのdivを検索すると、BeautifulSoupは何も返しません。私は以下のようにスクリプトを書いた。ここで何が間違っていますか？あなたはデータ（クラスFSとDIV）はajax.Whe

3熱

1答えて

BeautifulSoup - JSからjsonを抽出

私はBeautilfulSoupを使いこなしています.JS要素内で特定のjson文字列を取得する方法を探しています。ここJSです： <script>window.pinball = window.pinball || []; window.pinball.push(['add', {"srp_cleanup":"inactive","book_visit":"inactive","my_vis

0熱

1答えて

div-classまたはdiv-idの末尾からjsoupの内容でデータを抽出する

htmlページが2つあるとします。ページ1とページ2 のPage1は <div class="content"> <p></p> <p></p> </div> ようなHTMLが含まれているとPAGE2は今、私はそれがあれば言って、このコードで Document document = Jsoup.connect(url).get(); Elements links = doc

3熱

4答えて

jQueryが解析しないHTMLで何が問題になっていますか？

私はHTMLファイルをGETし、それを変数にjQueryオブジェクトとして割り当てようとしています。無駄に。スタックスニペットでGETリクエストが許可されているかどうかは分かりません。ここでもJSFiddle linkがあります。 var html = '<!DOCTYPE html><html lang="en"><head><title>Template</title></head><body