データを取り出し、タグなしで整理します。これは、このJavaのxpathとseleniumを使用したHTMLテーブルデータの解析
<table class="SpecTable">
<col width="40%" />
<col width="60%" />
<tr>
<td class="LightRowHead">Optical Zoom:</td>
<td class="LightRow">15x</td>
</tr>
<tr>
<td class="DarkRowHead">Digital Zoom:</td>
<td class="DarkRow">6x</td>
</tr>
<tr>
<td class="LightRowHead">Battery Type:</td>
<td class="LightRow">Alkaline</td>
</tr>
<tr>
<td class="DarkRowHead">Resolution Megapixels:</td>
<td class="DarkRow">14 MP</td>
</tr>
</table>
のようなものを見て、私はちょうどこれにプレーンテキストファイルに保存することができるような情報のすべての文字列を抽出することができるようにしたい:
光学ズーム:15倍デジタルズーム:6X電池のタイプ:アルカリ解像度 メガピクセル:14 MP
public static void main(String[] args) {
FirefoxProfile profile = new FirefoxProfile();
profile.setPreference("general.useragent.override", "some UA string");
WebDriver driver = new FirefoxDriver(profile);
String Url = "http://www.walmart.com/ip/Generic-14-MP-X400-BK/19863348";
driver.get(Url);
List<WebElement> resultsDiv = driver.findElements(By.xpath("//table[contains (@class,'SpecTable')//td"));
System.out.println(resultsDiv.size());
for (int i=0; i<resultsDiv.size(); i++) {
System.out.println(i+1 + ". " + resultsDiv.get(i).getText());
}
私はセレンとJavaでプログラミングしていると私は把握することはできませんそれに対する正しいXPath式。
誰かが私がこれを間違っている理由を理解して、このデータを正しく解析する方法を教えてもらえますか?私はセレンとXPathsに非常に新しいですが、私は仕事のためにこれが必要です。
また、誰かが私のためにSeleniumとXPathを速く学ぶための良い情報源を持っていれば、それらもまた非常に高く評価されるでしょう!
これは、Javaの問題ではなくCSHARP問題です。 – Horcrux7