0
私は、次のマークアップでの記事や画像へのリンクが含まれているXMLファイルの束を持っている:イメージURLをカスタムXMLファイルから抽出する方法は?
<url>
<loc>http://sample.com/sample-post</loc>
<lastmod>2015-12-27T16:42:07-01:00</lastmod>
<image:image>
<image:loc>http://sample.com/1234/5678.jpg</image:loc>
<image:title><![CDATA[tag1,tag2]]></image:title>
</image:image>
<image:image>
<image:loc>http://sample.com/1234/5678.jpg</image:loc>
<image:caption><![CDATA[tag1,tag2]]></image:caption>
</image:image>
</url>
私は、画像へのリンクを抽出し、重複を削除したいのですが、何のhref
属性が存在しないので、私はjQueryを使ってそれらにフックしてそれらを抽出することができます。このマークアップでこれを行う方法はありますか?どんな助けもありがとう。
P.S:インターネット上でこの質問の回答が複数ありますが、私のXMLにはhref
という属性がありません。
どのような言語ですか。これはSAXとJavaを使用して簡単に行うことができます。ここをクリックhttps://docs.oracle.com/javase/tutorial/jaxp/sax/parsing.html –
言語は関係ありません。それは私がそれをコンパイルすることができる限り、多くのライブラリを含めることなく、C++であることさえできます。 –
その後、Javaを実行します。 SAXは含まれているため、インポートする必要はありません。 APIは非常に簡単です –