2016-05-19 14 views
1

私はscalaでウェブサイト全体を取得し、その中から特定の情報を解析するか、取り出すことを試みています。 標準HTMLライブラリは、HTMLコンテンツを印刷しようとしているかのように私にとってはうまくいかず、HTML全体を印刷しませんか? Webページから完全なHTMLコンテンツを取得する方法はありますか?Scala Webページからhtmlコンテンツを取得

答えて

3

さてあなたは、優れたスカラ・スクレーパーライブラリhere使用することができます(とら:あなたはこのように読み取るコードを書くことができ
JSoup Javaライブラリのための その基本的にラッパーをGitHubから)

object NewsApp extends App { 
    val browser = JsoupBrowser() 
    val doc = browser.get("http://observador.pt") 

    println() 
    println("=== OBSERVADOR ===") 

    doc >> extractor(".logo img", attr("src")) |> println 
    doc >> extractorAt[String]("example-extractor") |> println 

    println("==================") 
    println() 

    doc >> ".small-news-list h4 > a" foreach println 
} 
+0

ありがとうございました!私はこの図書館を見ます! – Bajro

+0

お手伝いがあれば回答を受け入れてください。 –

関連する問題