0
2日前この目的コードは、意図したとおりに動作するウェブサイトからテキストを抽出するために作成しました。今、Android用にこれを実装する方法がわかりません。それは、XPath TFHppleのようなAndroid XPathのHTML解析(私は10行のObj-C実装が動作していますが、翻訳できません)
- のAndroidと本当に奇妙ないくつかのXPathコード皆ポストはHTMLファイルと互換性がないこと(のみ標準XMLが受け入れる)(HTMLを扱うことができます)
- JSoup私は今まさにサークルで歩いています。
基本的には、特定のURLのhtmlファイルから//h2/a
の要素を取得する必要があります。 私が書いた私のobj-cの実装を見てください。それは文字通り10行の作業コードですが、Androidで同じことをする方法を理解することはできません。
-(void)loadTutorials:(NSString*)startURLS {
NSURL *tutorialsUrl = [NSURL URLWithString:startURLS];
NSData *tutorialsHtmlData = [NSData dataWithContentsOfURL:tutorialsUrl];
TFHpple *tutorialsParser = [TFHpple hppleWithHTMLData:tutorialsHtmlData];
NSString *tutorialsXpathQueryString = @"//h2/a";
NSArray *tutorialsNodes = [tutorialsParser searchWithXPathQuery:tutorialsXpathQueryString];
NSString *podcastTitles[99];
int jjj=0;
for (NSString *string in tutorialsNodes) {
podcastTitles[jjj]=[[[tutorialsNodes[jjj] firstChild] content] stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceAndNewlineCharacterSet]];
NSLog(@"%@",podcastTitles[jjj]); //WORKING PERFECTLY FINE
jjj++;
}
}