可能性の重複:
Fast, lightweight HTML parser for C++HTMLをすばやく解析する最適な方法は何ですか?
私は、文字列で、ウェブサイトの内容を持っていると私はデータの約10枚を解析したいと思います。これを達成する簡単な方法は何ですか?&?
このタスクで正規表現を使用することは適切ではなく、何らかの種類のXMLパーサーを使用する必要があると聞いています。誰もがお勧めするものはありますか?
可能性の重複:
Fast, lightweight HTML parser for C++HTMLをすばやく解析する最適な方法は何ですか?
私は、文字列で、ウェブサイトの内容を持っていると私はデータの約10枚を解析したいと思います。これを達成する簡単な方法は何ですか?&?
このタスクで正規表現を使用することは適切ではなく、何らかの種類のXMLパーサーを使用する必要があると聞いています。誰もがお勧めするものはありますか?
専用のHTMLパーサを入手する必要があります。一般的なケースでは、XMLパーサーも正規表現も使用できません。世界で最もメンテナンスが困難なコードが必要な場合は、正規表現を使用して非常に特定のデータを抽出することができます。
良いアプローチについては、(c#)[HTML agility pack](http://htmlagilitypack.codeplex.com/)をご覧ください。これは.NETで広く使用されているトークナイザ/パーサーです。 – Oded
少し詳細を追加できますか?必要なデータは何ですか?ページはどのように見えますか? –
このサイトに掲載されているこの質問を参照してください:http://stackoverflow.com/questions/489522/library-recommendation-c-html-parser – Griffin
Dublicate? http://stackoverflow.com/questions/489522/library-recommendation-c-html-parser、正しい答えは "C++を使わないでください" –