HTMLの解析にHtml Agility Packを使用していますが、フォーマットの悪いメタタグに問題があります。Html Agility Packでメタタグの値が切り捨てられています
を考えると、このメタタグ:私は呼ん
"<meta name=\"productattributes\" value=\"shop: Baby|category: Category|category: Babies\" r\"us=\"\" exclusives|family:=\"\" strollers|name:=\"\" baby=\"\" trend=\"\" expedition=\"\" elx=\"\" travel=\"\" system=\"\" stroller=\"\" -=\"\" everglade|price:=\"\" 239.99\"=\"\">"
:
HtmlNode productAttributes = hap.DocumentNode.SelectSingleNode("//meta[@name='productattributes']");
var productAttributesStr = productAttributes.GetAttributeValue("value", "");
productAttributesStrは\」R」で切り捨てた値で終わるされた:
「ショップ:ベビー|カテゴリ:カテゴリ|カテゴリ:赤ちゃん "
私は間違っていますか?
私のHTMLではないので、解析するための回避策を見つけ出す必要があります。 htmlはtoysrus.comから来ています。 – rboarman
それを解析する前に、エラーを修正するためのカスタムフィックスアップルーチンを作成する必要があります。 (あるいは、供給元にソースを修正させる)。 – Quentin