htmlページから、以下のテーブルデータを持つ日付を抽出するにはどうすればよいですか?注文番号ごとに日付が変わります。私はそれを正しく使用しているかどうかはわかりません。お知らせ下さい。以下はhtmlページ(2017年6月10日)からのpythonスクレイピング日付
<tr>
<td style="font:bold 24px Arial;">Order #12345</td>
<td style="font:13px Arial;"><strong>Order Date:</strong> June 03, 2017</td>
</tr>
私は上記のコードを実行した後にエラーの下に取得しています
import requests
from bs4 import BeautifulSoup
#'url' is the actual link of html page
data = requests.get('url').content
soup = BeautifulSoup(data, "html.parser")
on = soup.find_all(text=re.compile("Order #"))
print (on)
od = soup.find_all(text=re.compile("Order Date")).next_element()
print (od)
を書かれているサンプルコードです。
Error :
['Order #12345']
Traceback (most recent call last):
File "test.py", line 24, in <module>
od = soup.find_all(text=re.compile("Order Date")).next_element()
AttributeError: 'ResultSet' object has no attribute 'next_element'
結果オブジェクトのリストで次の要素を呼び出そうとしていますが、リストをループして各要素の次の要素を呼び出してみましたか? –