html-parsing

    -1

    1答えて

    たとえば、Webページの正しいソースコードを取得するのに問題があります。このリンクでは、たとえばhttp://www.ebay.com/sch/Kitchen-Tools-Gadgets/20635/i.html?_from=R40&LH_ItemCondition=3&LH_BIN=1&LH_FS=1&LH_RPA=1&_mPrRngCbx=1&_udlo=&_udhi=50%22&_nkw=s

    1

    1答えて

    PHPの単純なHTML DOMパーサを使用して、ウェブサイトからスクレイプしたいと考えています。 ソースコードは、そのようなので、ランダムである:内部< pは> </P>、それは> <フォントを使用して入れています "(。。ロブはCo V)。詳細" を代わりに直接置くの <font face="Arial" color="#ff0000"> <p>Parameters</p>

    0

    1答えて

    標準のPython HTMLパーサーのみを使用してHTMLテーブルからデータをスクレイプします。私はコードが広く配布され、私はBeautifulSoupをインストールするために必要とする人々を支援するための時間を取ることができないので、株価のツールに固執する必要があり、lxlmlなど 例えば、HTMLコード: <table id="indexlist"> <tbody>

    -1

    1答えて

    私はPythonを使用してHTMLコードを解析しており、名前のリストを返す関数が必要です。私が探しているHTMLは次のようにフォーマットされ : <input type=hidden name=user value="msmith"> たびに、「タイプ=隠された」と「名=ユーザー」、私は、リストに含まれる「msmith」を希望しますエクスポートされた名前。 コードは移植可能でなければならず、b

    1

    1答えて

    で解析された後に拒否された私はProjekktorからダウンロードこのhtmlファイルを、している: <!DOCTYPE HTML> <html> <head> <title>Projekktor Version 8 Test</title> <link rel="stylesheet" href="theme/style.css" type="text/css" media="scree

    1

    1答えて

    私はhtmlの持っている:私はあなたの開始タグと繰り返し処理を要し、再帰的方法となるだろう [ "Span:This is the first text", "More text here", "Another line of text", "Span:Text in the span", "Span:Another text in span", "This is another li

    2

    1答えて

    WiktionaryのHTMLが個々の言語のセクションが実際にはないようにレイアウトされているように見えます対応するセクションのエントリを支配するノード。私は、特定の言語のためだけに、このセクションからのデータを取得したいと思います。私が興味があるかもしれないデータは、例えばスパン「IPA」されています。しかし、唯一のアイテムの上 [<span class="IPA" lang="">/dɒɡ/<

    2

    1答えて

    だから、私はウェブパーサーを作りましたが、それは良いことでしたが、<head>の中にいくつかの言葉が入っているのが見えました(そして<strong>も体内にあります)。私のコードはThis one here before nokogiriですが、私はRubyプログラミングの新機能で、数時間前にNokogiriについて知り始めました。 私は誰かがこの仕事をするのを助けてくれることを願っています。私は

    2

    2答えて

    htmlコードがあると、どのようにしてすべてのタグを削除できますか?例えば、私は私が Hello to <a href ="xx"></a> <img rscr="xx"></img> を維持したい <div><script bla bla></script><p>Hello all <a href ="xx"></a> <img rscr="xx"></img></p></div> がB

    0

    1答えて

    私は美しい石鹸(Pythonライブラリ)を使ってHTMLを解析しようとしています。誰も美しい石鹸を使用してHTMLの下で解析する方法を知っていますか? <span class="passingAlert bar"> <span class="fold-buttons"> <a href="#" onclick="fold();">Fold</a> | <a hre