Codename OneでHTMLページを解析する最善の方法は何ですか？

サービスを利用できないWebページから情報を読み取るためにHTMLを解析したいと思います。Codename OneでHTMLページを解析する最善の方法は何ですか？

JavaSEでは、中間形式をXMLとして処理する前に、HTML形式の整形と無関係な部分のフィルタリングを行うために、おそらくjsoupとHTMLサニタイザを使用します。

ランタイムにJavaSEの全範囲がないため、Codename Oneで任意のライブラリを使用するのは簡単ではありません。

コードネーム1を使用してHTML解析を行った人はいますか？どのようなアプローチが最適でしょうか？

コードネーム1の組み込みのXMLParserは、SGML（間違って形成されたXML）として構成されていてもHTMLを解析できます。十分な結果が得られるはずです。

また、BrowserComponentを使用してJavaScriptを使用してHTMLを読み込み、DOMクエリを使用してデータを解析することもできますが、これはコンポーネントを表示せずに可能性がありますが、それについて100％はわかりません。

2017-02-03 06:45:56

答えて