2
私はJsoupを使ってウェブページからリンクを抽出していますが、imgリンクを避けたいと思います。 ので、次のコード:子供が特定のタグを含んでいない要素を選択しました
Document doc = Jsoup.connect(i_Url).userAgent("chrome/5.0").get();
Elements links = doc.select("a[href]");
は私にすべてのリンクを取得しますが、それらのいくつかはイメージです。やって次の要素の(=リンク)子はimgタグを有するものであるので、
links.stream().filter(link -> !link.tagName().equals("img"));
は、例えば、動作しません:私はあらゆる種類のものを試してみました
<a href="index.htm" title="tutorialspoint">
<img alt="tutorialspoint" src="/java/images/logo.png">
</a>
、
Elements links = doc.select("a[href]").select(":not(img)"); //or
Elements links = doc.select("a[href]:not(img)"); //or
Elements links = doc.select("a[href]")
links.stream().filter(link -> link.children().contains(Tag.valueOf("img")));
私はちょうどあらゆる種類のバリエーションを試してみましたが、どれもうまくいきませんでした。私はhtmlに関しては大きな専門家ではない。 ヘルプをいただければ幸いです。おかげ