2017-02-02 10 views
1

サービスを利用できないWebページから情報を読み取るためにHTMLを解析したいと思います。Codename OneでHTMLページを解析する最善の方法は何ですか?

JavaSEでは、中間形式をXMLとして処理する前に、HTML形式の整形と無関係な部分のフィルタリングを行うために、おそらくjsoupとHTMLサニタイザを使用します。

ランタイムにJavaSEの全範囲がないため、Codename Oneで任意のライブラリを使用するのは簡単ではありません。

コードネーム1を使用してHTML解析を行った人はいますか?どのようなアプローチが最適でしょうか?

答えて

0

コードネーム1の組み込みのXMLParserは、SGML(間違って形成されたXML)として構成されていてもHTMLを解析できます。十分な結果が得られるはずです。

また、BrowserComponentを使用してJavaScriptを使用してHTMLを読み込み、DOMクエリを使用してデータを解析することもできますが、これはコンポーネントを表示せずに可能性がありますが、それについて100%はわかりません。

関連する問題