html-parsing

    0

    4答えて

    私はXHTMLドキュメント内で次き: <script type="text/javascript" id="JSBALLOONS"> function() { this.init = function() { this.wAPI = new widgetAPI('__BALLOONS__'); this.getRssFeed(); };

    45

    4答えて

    複雑なWebページのテーブルを解析するためにHTMLアジリティパックを使用したいが、私は何とかオブジェクトモデルで失われている。 私はリンクの例を見ましたが、このようなテーブルデータは見つかりませんでした。 XPathを使用してテーブルを取得できますか?私は基本的にどのようにテーブルを取得するためのデータを読み込んだ後に失われています。私は以前これをPerlでやっていましたが、少し不器用でしたが、

    6

    4答えて

    こんにちは、私がしたいことは、最初の段落の内容にかかります。 <p>Paragraph 1</p><p>Paragraph 2</p><p>Paragraph 3</p> 私はに実行している問題は、私が最初<p>タグと第1閉塞</p>タグの間のすべてをつかむために正規表現を書いていますということです:文字列$blog_postは、次の形式の段落の多くが含まれています。しかし、それは最初の<p>

    3

    7答えて

    私はJavaで少し問題があります。 これを行う方法:HTMLファイルでhrefタグとsrcタグを検索し、そのタグに関連付けられたURLを取得したいとします。 どのような方法が最適ですか? ありがとうございました。 よろしくお願いいたします。

    5

    7答えて

    任意の順序で2つ以上の正規表現が出現する可能性があることを示す方法はありますか?たとえば、XML属性は任意の順序で記述できます。 <a href="home.php" class="link" title="Home">Home</a> <a href="home.php" title="Home" class="link">Home</a> クラスとタイトルを確認して両方のケースで動作する

    2

    1答えて

    無効なHTMLコードから、理想的にはSystem.Xml.XmlDocumentを生成することができる.NETライブラリを探しています。 I.このような状況に直面したときに、ベストプラクティスの推測、修復、および置換ブラウザの種類を作成し、XmlDocumentを生成する必要があります。図書館もよく管理されていなければなりません。 :) 私はこれがたくさんあることを理解しています(あまりにも?)、