私はscalaでウェブサイト全体を取得し、その中から特定の情報を解析するか、取り出すことを試みています。 標準HTMLライブラリは、HTMLコンテンツを印刷しようとしているかのように私にとってはうまくいかず、HTML全体を印刷しませんか? Webページから完全なHTMLコンテンツを取得する方法はありますか?Scala Webページからhtmlコンテンツを取得
1
A
答えて
3
さてあなたは、優れたスカラ・スクレーパーライブラリhere使用することができます(とら:あなたはこのように読み取るコードを書くことができ
JSoup Javaライブラリのための その基本的にラッパーをGitHubから)
object NewsApp extends App {
val browser = JsoupBrowser()
val doc = browser.get("http://observador.pt")
println()
println("=== OBSERVADOR ===")
doc >> extractor(".logo img", attr("src")) |> println
doc >> extractorAt[String]("example-extractor") |> println
println("==================")
println()
doc >> ".small-news-list h4 > a" foreach println
}
0
どのようにScalaでhtmlページを取得していますか? 私はあなたがスプレークライアントで見ることができると思いhttp://spray.io/documentation/1.2.3/spray-can/http-client/
関連する問題
- 1. ScalaのAkka ResponseEntityからコンテンツを取得
- 2. facebook iframeから親ページのHTMLコンテンツを取得しますか?
- 3. 別のマシンから別のWebページからhtmlを取得
- 4. PHPを使用したPHP Webページからコンテンツを取得
- 5. Sitecore web API:SitecoreからHTMLコンテンツを取得する
- 6. Node.jsのWebページからコンテンツを取得しています
- 7. VBのHTMLリストからコンテンツを取得
- 8. XMLノードからHTMLでコンテンツを取得
- 9. pdf url(jsoup)からhtmlコンテンツを取得
- 10. htmlからコンテンツを取得する
- 11. NSData /ページからのコンテンツの取得
- 12. java多くのWebページのWebコンテンツを取得
- 13. WebページからPythonを取得する
- 14. PythonのWebページからDOMを取得
- 15. PythonでWebページからテーブルを取得
- 16. アクティブディレクトリを取得するhtmlページから
- 17. HTMLページからリンクを取得する
- 18. ローカルのhtmlファイルからWebサーバーのコンテンツを取得する方法
- 19. HTMLページから注入されたajaxコンテンツを取得する方法は?
- 20. APIのコンテンツHTMLを取得
- 21. LiferayでWebコンテンツを含むポートレット/ページを取得する
- 22. プログラムでWebページのコンテンツを取得する
- 23. Objective-CのWebサイトからHTMLデータを取得 - パースHTML
- 24. jsoupがWebページから一部のHTMLタグを取得していない
- 25. VBA複数のクラスがあるときにHTML Webページからテキストを取得
- 26. 外部のファイルからhtmlコンテンツを取得できますか?
- 27. JavaのページのHTMLコンテンツのみを取得する方法は?
- 28. OneNoteアドイン:HTMLコンテンツの取得
- 29. ブロックからコンテンツを取得
- 30. コンテンツからURLを取得
ありがとうございました!私はこの図書館を見ます! – Bajro
お手伝いがあれば回答を受け入れてください。 –