小さな、光パーサが、それは私のコードはここに、ここでは重要ではありませんが、私の場合はJsoup.parseが理由だけで、ファイルサイズのクラッシュした場合Jsoupではなく他のパーサーですか?
使用することをお勧めし:
Document doc = Jsoup.parse(html);
Element table = doc.getElementsByTag("table");
return table;
これは実際に動作しますが、このコードをPC(dalvik仮想マシン)またはAndroidデバイス(Android OS用に開発中)で実行すると違いがあります。私は正確に何が問題なのか分かりませんが、メモリ(ヒープサイズ)がデバイス上で大きくなっているようですが、これまでチェックしていません。それは単なる仮定です。 私はJsoupについて何が言えるのですか?私は、DOMベースで純粋なHTMLコードを解析してきれいにするのに適した、最速で小さなライブラリを推測しています。タグ(tr、table、...など)に基づいてHTMLの一部をextarcする必要がある場合は、Jsoupが最良のオープンソースのHTMLパーサです。また、コードに適用する場合は、上の例に示すように、必要な行は2行だけです。 elemnetsを取得した後、またはHTMLの一部を抽出した結果は、Jsoupで選択したタグを含む単純なStringです。私はそれがより多くの機能を持っていると確信して、ちょうどもっと複雑なものを使用したことはありません。
コードを表示してください。 –
が投稿されました。それはあなたを助けることはありません –
HTMLをクリーンアップする必要がありますか、または有効なXMLが入っていることを確認できますか? –