2016-08-28 9 views
0

私は、WebページをスクレープするためにSelenium LibraryでJavaを使用しています。私はFirefoxでページ上のFirebugを使用すると、私はページのソースには、次のHTML構造が含まれていることを確認できます。FirebugをHtmlUnitDriverのpageSourceレポートに一致させるにはどうすればよいですか?

<div> 
    <div> 
     <table> 
      <caption /> 
      <thead /> 
      <tbody /> 
     </table> 
    </div> 
</div> 

しかし、私はプログラム的に、その後driver.getPageSource()を使用し、HtmlUnitDriverを使用して、ページのソースをダウンロードする際に、 HtmlUnitDriverの報告書は、Firebugのによって与えられたものと異なるのはなぜ

<div> 
    <table> 
     <caption /> 
     <tbody /> 
    </table> 
</div> 
  1. :私は、対応するHTML構造に変更したことを参照してください?
  2. HtmlUnitDriverがレポートする方法に従ってHTML構造を検査できるように、Firebugを設定できますか?

答えて

1

FirebugはHTML構造を調整しないことに注意してください。つまり、統合された開発者ツールでは同じように見えるはずです。

<div><thead>は、ページ上で実行されているJavaScriptによって追加されます。

これは、JavaScriptを無効にすることで確認できます。 about:configに行き、javascript.enabledfalseに設定するか、NoScriptまたはGhosteryのようなアドオンを使用して設定します。

+0

遅いコメントに申し訳ありません。私は数日間コンピュータから離れていました。 JavaScriptを無効にした後、Firebugを使用してページのHTMLを検査したところ、HtmlUnitDriverのレポートと同じになりました。どうもありがとう! – Martin

関連する問題