私は、自動取得のhtmlソースのコンテンツから動的にコンテンツを読み込む何かをしています。以前はRegexを使ってデータを取得していますが、私の友人の中にはDOMを使用した方が速くなるのですが、その理由は何ですか?DOM解析とRegexの間のパフォーマンス
0
A
答えて
3
DOMはHTMLを解析するように設計されています。 Regexを使ってHTMLを解析することについて投稿すると、このサイトで多くの人が作業するようになります(昨日、いくつかの記事を見ただけです)。 何をしているかによって、Regexを使ってHTMLから特定の項目を取得したり、HTMLに特定のタグがあるかどうかを調べたりしますが、データを取得したり、HTMLを解析しようとすると、優れたDOMパーサを使用するほうが良い。
PHP DOMパーサーは有効なHTMLを必要とするなど、使用するDOMパーサーの種類に注意する必要があります。そのため、HTMLを整理して期待通りになるまで整理しなければなりませんでした結果。 ここでは、無効なhtmlを処理できる単純なDOMパーサがあります:http://simplehtmldom.sourceforge.net/index.htm 私は、100%正ではないhtmlの要素属性を調べるために上記を使用しています。
関連する問題
- 1. Domドキュメントの解析
- 2. HttpHandlerのパフォーマンス解析
- 3. XML解析のパフォーマンス
- 4. XML DOM解析。
- 5. jsonとgsonの間のjson構文解析のパフォーマンス
- 6. DOMを解析するDOM
- 7. IEでのDOMの解析
- 8. DOMを解析するためのDOM
- 9. アセンブリ言語の解析Regex
- 10. Apache igniteのパフォーマンス解析
- 11. Tensorflowのパフォーマンス解析ツール
- 12. pysparkフィルタリングコードのパフォーマンス解析
- 13. HTML DOMテーブルを解析するPHP DOM
- 14. 名前空間がある場合のAndroid XML DOM解析
- 15. PythonとRegexでdhcpd.leasesを解析する
- 16. Xml DOM解析中null
- 17. DOM - ノードからのテキストの解析
- 18. のJava:XMLのDOM解析は、アレイ
- 19. Android用メモリ/パフォーマンス解析ツール
- 20. 単純なHaskellパフォーマンス解析
- 21. REGEX:大きな文字列の解析
- 22. pythonのregexでURLを解析する
- 23. ユーザーエージェントのRegexによる解析
- 24. XML解析のヘルプPython lxml、etree、dom
- 25. JS内のリモートDOMを解析する
- 26. AndroidのDOM解析がtooo遅い
- 27. DOM解析およびJavaScriptの実行
- 28. JavaScriptを使ったDOM解析のブロック
- 29. regex/php:文字列から時間を解析しますか?
- 30. GNU Makeファイルのパフォーマンス解析方法