Beautifulsoupと正規表現を使用して、Webサイト(http://www.gatherproxy.com/)からIPアドレスを取得しようとしています。私は、IPアドレスは次の形式で存在することを見たウェブサイトを調べてbeautifulsoupと正規表現を使用してプロキシWebサイトからIPアドレスを取得する方法
、:
<tr class="proxy 149-56-34-94-225F" prx="149.56.34.94:8799" time="2017-03-29T15:42:33Z" type="Transparent" country="United States" port="8799" tmres="797"><td>2m 54s ago</td><td>149.56.34.94</td><td><a>
<tr class="proxy 138-68-180-44-1FB6" prx="138.68.180.44:8118" time="2017-03-29T15:42:32Z" type="Elite" country="United States" port="8118" tmres="47"><td>3m 25s ago</td><td>138.68.180.44</td><td><a>
だから私は、各タグ
soup.find_all(name='tr',attrs={'class':re.compile(r"proxy [0-9a-zA-Z]+-[0-9a-zA-Z]+-[0-9a-zA-Z]+-[0-9a-zA-Z]+-[0-9a-zA-Z]+")})
を取得するには、次のコードを使用していますが、出力はあります何もない。
ありがとうございました!あなたのコードは完全に機能します。私の前のコードがうまくいかない理由を知っていますか? – shawn123
あなたが見つけようとしていた 'tr'はJavaScriptで生成されますが、これはBeautifulSoupが解析できません。あなたはその種のもののために 'セレン 'を使うことができます。 – Zroq