2012-04-23 13 views
0

私は、以下のWebページから2枚、記事-体を抽出しようとしている、との記事・画像Androidでウェブサイトを解析/スクラップするライブラリですか?

からsrcが、誰もがJavaの

に、これらの2枚の抽出については移動する方法を私を見ることができますhttp://www.ncataggies.com//ViewArticle.dbml?DB_OEM_ID=24500&ATCLID=205417767

+2

「最高」を求めることは、通常、ここではうまくいきません。交換は実際に投票用に設定されていません。あなたはまた、1つの図書館が別の図書館よりも優れていると判断できる基準を与えていません。 – sarnold

+0

私は、誰かがよく知っている図書館を探しているだけで、そのデータをどのように抽出するのかについてのヒントがあると思います。 – user1154644

+0

Jsoupはとてもうまく動作します。 – Torious

答えて

0

JavaまたはJavaScript?

私がこれを行う場合、私はURLのソースを開き、class = "article-body"の中からテキストを取得し、class = "photocopy"の中でテキストを取得することにしました。 src = ""これにより、すべてのテキストと画像のソースが得られます。

ページをロードし、基本的な文字列操作を使用して適切なクラスを見つけて内容を抽出してください。

これは役に立ちますか?特定のコードの助けが必要な場合は、最初に試してみて、あなたが持っているものを投稿すれば、そこからあなたを助けることができます。

+0

何らかの理由で、JSoupを使用しようとするとNoClassDefFoundErrorが発生します。私は間違いなくjarファイルを追加しましたが、何が起こっているのかは分かりません。 – user1154644

関連する問題