2017-02-03 1 views
1

コードネーム1を使用してウェブサイトを解析する必要があります。 HTMLParser(https://www.codenameone.com/javadoc/com/codename1/ui/html/HTMLParser.html)という名前のクラスがありますが、動作していないようです。少なくとも私はそれを実行することはできません。XMLパーサーを使用せずにコードネーム1でHTMLを解析する

代わりに私は喜んで働いたXMLパーサーを使用しようとしました。しかし、それを使ってHTMLを解析すると、ブレーク(br)のような非XHTML準拠のタグに関する問題が発生しました。それらは私のHTMLを不正にするので、私はそれを予測することができません。

HTML Parserを動作させる方法や他の方法がありますか?

EDIT: 私はJSoupを使用して私のための解析作業を行うサーブレットを書くことにしました。良い習慣に見えます。

答えて

0

HTMLParserクラスは非難されたHTMLComponentによって使用されました。それはあまりにも非難されている必要がありますそれなしで無駄です。

XMLParserには、コードネーム1に組み込まれているすべてのHTML解析機能が含まれています。それは非適合のbrタグでも機能するはずですが、自己終了タグとオープンタグのようなものでは矛盾するかもしれませんが、ほとんどのそのようなユースケースを実装できるはずです。

+0

すぐにお返事ありがとうございましたが、ウェブサイトの解析にまったく矛盾があり、さらに進めないケースがありました。だから私はサーブレットに切り替えました。 – BullshitPingu

+0

もう一つのオプションは、jsoupのようなものを移植することです。これは自明ではありませんが、おそらく実行可能です。 –

+0

はい、私はそれを試しましたが、食い違っていると報告された450のエラーで延期されました。彼らは主に、Java SEのRegexが欠落していたためです。しかし、コードネームワンはあなたのために解決策としてREを持っているので、あなたはまったく正しいです! – BullshitPingu

関連する問題