私は私が面白いんだ反復コードが含まれているPHPファイルを、得た。ここでは一例だPythonでbeautifulsoupを使用して特定の要素をスクラップする方法は?
<a href="/browse.php?cat=298"><img src="/Static/icons/cat_black_mirror.jpeg" alt="Черное зеркало" title="Черное зеркало" align="left" class="category_icon" border="0" /></a>
<span class="torrent_title"><b>Заткнись и танцуй (Shut Up and Dance)</b></span><br />
Дата: <b>01.01.2017 20:51</b><br />Звук: <b>Многоголосый закадровый (LostFilm.TV)</b>
</span>
私は面白いよ、何が急流タイトルとリンクです。しかし、クラスでスパンに行くことを試みた。後にリンクを探してください。ここにある例
url = 'http://www.lostfilm.tv/browse.php?'
lost_f = requests.get(url, headers={'User-Agent': 'Mozilla/5.0'})
lost_soup = BeautifulSoup(lost_f.text,'html.parser',from_encoding="windows-1251")
for item in lost_soup.findAll('span', {'class': 'torrent_title'}):
print item.text
print item.previous_sibling.previous_sibling['href']
結果:名前+不正なリンク。どのように私はトレントの名前と関連リンクを得ることができますか?
は私のために正常に動作します。あなたはどんなリンクを手に入れますか?このページに問題があるように見えます。画像やリンクはタイトルとは異なります。 –