2011-08-15 1 views
0

小さなパーサが、それは私のコードはここに、ここでは重要ではありませんが、私の場合はJsoup.parseが理由だけで、ファイルサイズのクラッシュした場合Jsoupではなく他のパーサーですか?

使用することをお勧めし:

  Document doc = Jsoup.parse(html); 

      Element table = doc.getElementsByTag("table"); 
      return table; 

これは実際に動作しますが、このコードをPC(dalvik仮想マシン)またはAndroidデバイス(Android OS用に開発中)で実行すると違いがあります。私は正確に何が問題なのか分かりませんが、メモリ(ヒープサイズ)がデバイス上で大きくなっているようですが、これまでチェックしていません。それは単なる仮定です。 私はJsoupについて何が言えるのですか?私は、DOMベースで純粋なHTMLコードを解析してきれいにするのに適した、最速で小さなライブラリを推測しています。タグ(tr、table、...など)に基づいてHTMLの一部をextarcする必要がある場合は、Jsoupが最良のオープンソースのHTMLパーサです。また、コードに適用する場合は、上の例に示すように、必要な行は2行だけです。 elemnetsを取得した後、またはHTMLの一部を抽出した結果は、Jsoupで選択したタグを含む単純なStringです。私はそれがより多くの機能を持っていると確信して、ちょうどもっと複雑なものを使用したことはありません。

+0

コードを表示してください。 –

+0

が投稿されました。それはあなたを助けることはありません –

+0

HTMLをクリーンアップする必要がありますか、または有効なXMLが入っていることを確認できますか? –

答えて

1

あなたは、htmlを解析しようとしていると推測しています。

+0

htmlドキュメントの一部を抽出し、選択したコンポーネントで新しいStringを作成することは可能ですか? –

関連する問題