2つのHTMLタグの間のテキストを抽出して文字列に格納する必要があります。次のように私が解析するHTMLの例は次のとおりです。Android:2つのHTMLタグ間でテキストを抽出
<div id=\"swiki.2.1\"> THE TEXT I NEED </div>
私はパターン(swiki\.2\.1\\\")(.*)(\/div)
を使用して、私はグループ$ 2からする文字列を取得するJavaでこれを行っています。しかし、これはアンドロイドでは機能しません。 $ 2の内容を印刷すると、何も表示されません。なぜなら、一致が失敗するからです。
誰もがAndroidでregexを使用して同様の問題を抱えていたか、または最初の場所でHTMLページを解析するためのより良い方法(非正規表現)があります。ここでも、これは標準のJavaテストプログラムでうまく動作します。どんな助けでも大歓迎です! XPathと当然のアンドロイドとの素晴らしい作品http://htmlcleaner.sourceforge.net/
素晴らしいlibに:私は常にHtmlCleanerを使用するHTML構文解析-もののため
http://jsoup.org/アンドロイド用のバージョンが必要です...あなたのエラー/マッチについて失敗しているかもしれません...おそらくあなたがこのウェブサイトのモバイル版をロードしているデバイスで... – Selvin
Thats非常に良い点。しかし、私はちょうどHTMLをチェックし、私が探しているものは、サイトのモバイル版では同じです。私は今、そのリンクを見て、後で返信します。ありがとう –