2016-05-10 12 views
1

私が取り組んでいるプログラムのJavaエレメントを表示するために、ウェブサイトからHTMLコードを解析しようとしています。ここでウェブサイトからのHTMLコードの解析とJavaエレメントへの表示

は、私が解析しようとしているかを示した画像です: enter image description here

私はarso.siからHTMLを解析するためにjsoupライブラリを見てきました。

コードの特定の部分を解析する方法と、プログラムでそれを表示するために使用する要素についてアドバイスします。 ありがとうございます。ここで

+0

何を試しましたか?最初に自分で行ってください。人々はもっと助けてくれるでしょう – Draken

+0

Document Formatでその要素からHTMLコードを取得できますが、どの要素をnetbeansで使うべきですか? – erik

答えて

0

を解析するjsoupを使用する例です。

セレンを使用することができます(http://www.seleniumhq.org/projects/webdriver/)。

PhantomJSDriverを使用してサイトにアクセスし、getScreenshotAs関数を呼び出すことができます(詳細と例はhttp://www.seleniumhq.org/docs/04_webdriver_advanced.jspです)。

+0

ありがとうございますこれは私が探していたものです! – erik

+0

私はそれを取った後イメージをトリミングする方法について助言していますか?セレンにはその機能がありますか?再度、感謝します! – erik

+0

WebDriverには、要素の位置とサイズ(ピクセル単位)を返す関数もあります。これを使って切り抜くことができます。 –

0

は、あなたがウェブサイトの一部を取り、それはあなたのアプリケーションに(視覚的)であるとして、それを表示しようとしている私の理解にhtml

public static void parseTitleData(String response){ 

     if (response!=null&&!"".equals(response)) { 
      Document doc = Jsoup.parse(response); 
      //css selector 
      Elements linksElements = doc.select("div[class=article_list mtop10]>ul>li>a"); 

      for (Element ele:linksElements) { 
       String href = ele.attr("href"); 
       String title = ele.text(); 
       News news =new News(); 
       news.setPath(href); 
       news.setTitle(title); 
      } 
     } 
    } 
関連する問題