2012-02-22 4 views
0

いいですか?さて、私はJSoupのような他のサードパーティのライブラリを使用していますが、それは素晴らしい作品ですが、このプロジェクトでは違うのです。そこから1つのアイテムを取得したいときにドキュメント全体を読み込んで解析する価値はありますか? htmlページの中にはシンプルなものもありますので、Stringメソッドも使用できます。原因はメモリが問題になり、ドキュメントを読み込むまでにも時間がかかります。 XMLを解析するときには、SAXパーサーはメモリにロードされず速いため、常にSAXパーサーを使用します。私はhtmlドキュメントで同じことを使うことができますか、それとも既にこのようなものがありますか?したがって、非DOM HTML軽量パーサーがあれば、それも素晴らしいでしょう。プレーンなStringメソッドを使用したJava Parser HTML?

+0

単なる考えです。文字列を探している場合は、オペレーティングシステムがあなたの仕事をより速く行うことができるかもしれません。正規表現でgrepのいくつかの種類は、あなたの環境に依存します –

+0

それは主にAndroidになるつもりです –

+0

私は本当にアンドロイドについては何も知らないが、私は[this](http://www.freeyourandroid.com/guide/)を見つけたlinux-unix-shell-commands-android)と[this](http://forum.xda-developers.com/showthread.php?t=1509517) –

答えて

1

HTMLがXMLに準拠している場合(つまりXHTMLの場合)、標準のSAXパーサーを使用できます。ここでは、JavaのHTMLパーサーのリストを、http://java-source.net/open-source/html-parsersから選択することができます。 HotSaxはおそらくすべてのユースケースを処理します。

+0

ありがとう私はそれらを試してみましょう –

関連する問題