こんにちは私はNSXMLParserを使用してXML文書をループしていて、説明タグに問題があります。NSXMLParser RSSの奇妙な文字の問題
一部のニュースサイトでは、タグ内に奇妙な文字(HTMLタグ、<、>など)があり、解析が期待通りに行われません。誰か助けてもらえますか?
ありがとうございます。
こんにちは私はNSXMLParserを使用してXML文書をループしていて、説明タグに問題があります。NSXMLParser RSSの奇妙な文字の問題
一部のニュースサイトでは、タグ内に奇妙な文字(HTMLタグ、<、>など)があり、解析が期待通りに行われません。誰か助けてもらえますか?
ありがとうございます。
エンティティ参照は、それらが表す文字に変換する必要があります。どのHTMLタグも取り除かれるか、UIWebViewに渡される必要があります。そして、あなたは、単に文字列操作によって、他の不要な文字を置き換えることができます
- (NSString *)flattenHTML:(NSString *)html {
NSScanner *theScanner;
NSString *text = nil;
theScanner = [NSScanner scannerWithString:html];
while ([theScanner isAtEnd] == NO) {
[theScanner scanUpToString:@"<" intoString:NULL] ;
[theScanner scanUpToString:@">" intoString:&text] ;
html = [html stringByReplacingOccurrencesOfString:[NSString stringWithFormat:@"%@>", text] withString:@""];
}
//
html = [html stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceAndNewlineCharacterSet]];
return html;
}
:あなたがこれを行うために必要なHTMLタグをスキップする
文字は、パーサーによって '<''>'文字で識別されます。どのようにxmlparserにフィードする前にそれを解析する任意のアイデア? – likki
したがって、角括弧は一重引用符で囲まれていますか?その場合、パーサーに送信する前に、常に '<'のすべてのインスタンスを< and '> '>に置き換えることができます。 – jessecurry
。
これが役に立ちます。
おかげで、
Madhup
ご回答いただきありがとうございます。奇妙な文字はdescriptionタグの中にあります(
@likkiあなたが解析しようとしているサンプルの応答と、あなたが問題に直面している部分を表示してください。 –
コードを入力してください。 – squeezemylime