Webページから特定の情報を取得する

Qtを使用してWebページから特定の情報を取得する方法を探しています。これまではQNetworkAccessManagerを使用していて、ページ内のすべてを含むHTTP応答を取得できました。Webページから特定の情報を取得する

この情報をフィルタリングしてxmlを解析して関連情報を取得する正しい方法は何ですか？たとえば、ウィキペディアに情報を問い合わせたいのであれば、ページのソースコードではなく、情報だけをどのように保存するのですか？

2016-04-13 compsci94

コンテンツを解析し、必要な情報のみを取得して保存することができます。

Qtには、そのためのツールがいくつか用意されています。

wikiにはそれに関する詳細があります。

有効なXMLであればXML Handling classesを使用できます。wikiに記載されているように、他のツールを使用して壊れたXML HTMLページを有効なXMLに変換できます。

HTMLファイルの検証と修復を行うにはlibTidy

2016-04-13 13:00:43 danielfranca

答えて