Hey私は文字列で私に送られるhtmlのデータを解析したい。 私が望むデータは大文字であり、ここではDATAxと名付けます。 データの長さは任意です。文字列からhtmltagsをパースするjava/gwt
http://pastebin.mozilla.org/1270216
私が解析する必要があり、このような、より多くの行があります。
返信する
Hey私は文字列で私に送られるhtmlのデータを解析したい。 私が望むデータは大文字であり、ここではDATAxと名付けます。 データの長さは任意です。文字列からhtmltagsをパースするjava/gwt
http://pastebin.mozilla.org/1270216
私が解析する必要があり、このような、より多くの行があります。
返信する
私はjsoupで幸運を祈っています。これは、jQueryスタイルのDOMノードセレクタを使用し、非常にフォーマットの悪いHTMLフラグメントでも動作します。
私はjsoupについてよくわかりませんが、TagSoupは素晴らしいHTML解析ライブラリです。私は何年も前から数万(少なくとも)の野生のウェブページに対して実行されていた生産システムでそれを持っていました.TagSoupからの失敗は一度もありませんでした。それは、恐ろしいフォーマットのHTMLでも可能です。
この文字列から抽出しようとしているデータの種類に関する詳細な情報を提供する必要があります。この場合、 'DATAx'という文字列はこの状況では役に立ちません。また区切り文字なし(各データ間のカンマのような)は非常に困難です。 – Arj
投稿にコードを入れようとしています:) – Alb
その文字列とダブルスをhtmlから取得したい – Alb