2017-12-11 28 views
0

私は(<a href="https://search.google.com/structured-data/testing-tool" rel="nofollow noreferrer">Google Structured Data Test Tool</a>がやって道のような)プログラムでHTMLコンテンツから<a href="http://schema.org/" rel="nofollow noreferrer">microdata schema</a>を解析するミクロスキーマパーサ

JobPostingWebsiteスキーマを含むHTMLを与え、ツールは2つのオブジェクトJobPostingWebsiteを検出し、返します。関連するプロパティ情報を含む。

これにはどのような方法が最適ですか? でHtmlコンテンツを検証するか、通常のHTML処理を行うには、XSDスキーマを作成する必要がありますか?それを行う良いライブラリがありますか?

答えて

1

私はこのタスクを達成するためのライブラリを作成しました。ライブラリはHtmlAgilityPackライブラリに基づいています。コードはGitHubの上に配置されている:https://github.com/minhnguyenlinknode/MicroSchemaParser

使用:

var microSchemaParser = new MicroSchemaParser(yourHtmlString); 

// Detect all supported schemas 
List<ISchema> allSupportedSchemas = microSchemaParser.Parse(); 

// Find a specific schema 
var schema = microSchemaParser.Find<ItemListSchema>(); 

// Check the schema validation 
var validateResult = itemListSchema.Validate(); 
関連する問題