-1
私はプロジェクトに取り組んでいます。別のWebページの別のテーブルから在庫データを取り出すようにlxmlを設定しようとしています。私はプルしようとしている値を印刷しようとしている私のプログラムを実行すると、私は、空のブラケットを得るXpathが値を返さないlxml Python
('Cash_and_short_term_investments:', [])
('EPSNextYear:', [])
ここで私はこの呼び出しています方法を見ている:
#the url at this point is http://finviz.com/quote.ashx?t=RAIL confirmed with print statement
url = driver.current_url
page2 = requests.get(url)
tree2 = html.fromstring(page2.content)
EPSNextYear =
tree2.xpath('/html/body/table[3]/tr[1]/td/table/tr[7]/td/table/tr[2]/td[6]/b')
#Original XPath:/html/body/table[3]/tbody/tr[1]/td/table/tbody/tr[7]/td/table/tbody/tr[2]/td[6]/b
print ('EPSNextYear:', EPSNextYear)
と:
を#the url at this point is https://www.google.com/finance?q=NASDAQ%3ARAIL&fstype=ii&ei=hGwhWNHVPOW7iwLMiIfIDA I've confirmed this with a print
url = driver.current_url
page3 = requests.get(url)
tree3 = html.fromstring(page3.content)
Cash_and_Short_Term_Investments = tree3.xpath('//*[@id="fs-table"]/tr[3]/td[2]/text()')
print('Cash_and_short_term_investments:', Cash_and_Short_Term_Investments)
いくつか同様の質問が示唆しているように、私はXPathからtbodyを削除しました。どんな助けや提案も大変ありがとうございます。
これは文字列を取得するのに良い解決策です。正規表現を使ってRegexを使って数値を分離しました。 – Marc