11
A
答えて
8
これまではHTMLAgilityPackを使用していましたが、HTMLの解析に問題があるか、終了タグがありませんでした。しかし、それは約2年前でした。
私はたいてい、SGMLReaderに向かっていましたが、これはXMLリーダーでラップすることができるため、C#でXDocumentまたはXmlDocumentを簡単に使用してHTMLを読み取ることができます。 SGMLReaderは、私がそれにスローしたすべての不正なHTMLに取り組んできました。
関連する問題
- 1. C言語のfloat_fast(stdint.hのint_fastに似ています)
- 2. 変更ビュー、plot3D、Julia言語(matplotlibに似ています)
- 3. gcc CコンパイラはC言語で書かれていますか?
- 4. elasticsearchのJQL(jiraクエリー言語)に似た人間にとって使いやすいクエリ言語
- 5. C#はスクリプト言語に適していますか?
- 6. C言語でD言語DLLを使用していますか?
- 7. Objective-C構文はどのように英語に似ていますか?
- 8. デバッグC/C++言語は、ブレークポイント
- 9. C言語で多言語を使用するには
- 10. は、ループの典型的なCに似た言語Aでのpython
- 11. 関数はC言語のストレージクラスを持っていますか?
- 12. C++:C言語リンケージ
- 13. 他の言語(phpjsに似ています)を知っている人のクロスランゲージライブラリは何ですか?
- 14. 他の言語のGoroutine類似体
- 15. C言語:リンクリスト
- 16. 言語C - QuickSort
- 17. 言語C、セグメンテーションエラー
- 18. C言語、」、
- 19. (C言語)
- 20. C言語ポインタ
- 21. C言語ポート
- 22. C言語ビットトリック
- 23. C言語エラー
- 24. コンパイラの違い。 C言語
- 25. シンプルな疑似コード言語用のパーサーを作成していますか?
- 26. 呼び出すC言語は、C#
- 27. RegexはC言語で動作していません
- 28. 関数は、Cプログラミング言語
- 29. ここでの宣言はC言語で許可されていません。
- 30. 関数言語をC言語にコンパイルする
私は以前(約5/6年前!?)http://htmlagilitypack.codeplex.com/でこれを簡単に使っていましたが、私が必要としていたものは大丈夫でしたが、広範囲にテストしたり、そのペース... –
http://developer.mindtouch.com/SgmlReader 私は過去にこれを使ってHTMLを解析しました。かなり疑わしいHTMLでかなり信頼できました – Pete