を解析するためにPythonとBeautifulSoupを使用します。私は最初のtdタグを基準(findで)、またはそれらすべて(findAllで)に合わせることができます。私はPythonとBeautifulSoupで特定のtdタグ内のコンテンツにアクセスしようとしています。表
今、私はそれらすべてを取得し、findAllのを使用して、私はそれらのうちの欲しいコンテンツを取得、それは(私は検索に制限をつけていても)非効率的であるように、それは思えることができます。私が望む基準を満たす特定のtdタグに行くためにとにかくありますか?第3、第10と言ってもいい?
ここに私のコードは、これまでのところです:
from __future__ import division
from __future__ import unicode_literals
from __future__ import print_function
from mechanize import Browser
from BeautifulSoup import BeautifulSoup
br = Browser()
url = "http://finance.yahoo.com/q/ks?s=goog+Key+Statistics"
page = br.open(url)
html = page.read()
soup = BeautifulSoup(html)
td = soup.findAll("td", {'class': 'yfnc_tablehead1'})
for x in range(len(td)):
var1 = td[x]
var2 = var1.contents[0]
print(var2)
Hrm、それは私が私がする必要があることをさせるかもしれません。私は仕事の後に今夜テストをします。 –
これは、同じ情報を持つ同じタグであることがわかります。子供をチェックする能力がない限り、おそらく。 –
はい、同じタグですが、trueまたはfalseを返すかどうかを決定する前に子タグをチェックすることができます。 – cerberos