いいですか?さて、私はJSoupのような他のサードパーティのライブラリを使用していますが、それは素晴らしい作品ですが、このプロジェクトでは違うのです。そこから1つのアイテムを取得したいときにドキュメント全体を読み込んで解析する価値はありますか? htmlページの中にはシンプルなものもありますので、Stringメソッドも使用できます。原因はメモリが問題になり、ドキュメントを読み込むまでにも時間がかかります。 XMLを解析するときには、SAXパーサーはメモリにロードされず速いため、常にSAXパーサーを使用します。私はhtmlドキュメントで同じことを使うことができますか、それとも既にこのようなものがありますか?したがって、非DOM HTML軽量パーサーがあれば、それも素晴らしいでしょう。プレーンなStringメソッドを使用したJava Parser HTML?
0
A
答えて
1
HTMLがXMLに準拠している場合(つまりXHTMLの場合)、標準のSAXパーサーを使用できます。ここでは、JavaのHTMLパーサーのリストを、http://java-source.net/open-source/html-parsersから選択することができます。 HotSaxはおそらくすべてのユースケースを処理します。
+0
ありがとう私はそれらを試してみましょう –
関連する問題
- 1. HTML Parser for response - Java
- 2. プレーンな古いHTMLを使用したフローレイアウトの動作?
- 3. 静的メソッドを使用したStringクラス
- 4. ngFormまたはプレーンHTML * ngForを使用した可変長入力
- 5. RegEXを使用したプレーンHTMLファイルのカット
- 6. プレーンなHTMLスクリプトをjsx
- 7. - JavaのString.equal(String)メソッド
- 8. PHP - シンプルなHTML Dom Parser
- 9. Simple HTML DOM Parserを使用してJavascriptからコンテンツを検索
- 10. プレーンJavaScriptを使用したPDF署名
- 11. BeautifulSoup Parser Confusion - HTML
- 12. JavaScript:document.createNodeまたはプレーンhtml?
- 13. JSONをWebpackを使用したプレーンなJSONファイルとしてバンドル
- 14. Java Dom Parserを使用してxmlを解析する
- 15. ネストされたメソッドを使用したVoid to Stringメソッドの変換
- 16. Javaを使用したAndroidのメソッドSwizzling
- 17. JavaテストJUnit(void)を使用したメソッド
- 18. react-html-parser unexpected error
- 19. Cobraを使用したJava HTMLレンダリング
- 20. JAVAバックエンドを使用したHTMLデスクトップアプリケーション
- 21. のJava - メソッドget(クラス)String型
- 22. <String、Integer>タイプのjavaのgetValueメソッドの使用
- 23. .Net WikiText to HTML Parser
- 24. Java RTF Parser
- 25. Java DOM Parser XML
- 26. 未使用import文java string
- 27. HTMLアンカータグを使用したPOSTメソッドの使用
- 28. javaメソッドのString []配列をカンマなしで返す
- 29. jQueryを使用した大規模なHTML、改行、および.html()メソッド
- 30. Java - 複数のonClickListenerを使用した効率的なメソッド
単なる考えです。文字列を探している場合は、オペレーティングシステムがあなたの仕事をより速く行うことができるかもしれません。正規表現でgrepのいくつかの種類は、あなたの環境に依存します –
それは主にAndroidになるつもりです –
私は本当にアンドロイドについては何も知らないが、私は[this](http://www.freeyourandroid.com/guide/)を見つけたlinux-unix-shell-commands-android)と[this](http://forum.xda-developers.com/showthread.php?t=1509517) –