2017-01-16 7 views
0

は、私はこのようなページからメールを取得する必要がありますHTML、ダウンロードページに「...」と表示されますこのコードでは、プロフィール画像の下に表示されている2つのメールが見つかりませんが、興味のないページの下に配置されているメールが見つかります。Pythonの3メール

なぜHTMLページ全体をダウンロードしたのでしょうか?メールがどこにあるのかを知るためには、メールがどこにあるのか、そしてその下の行にある警告を読むことができます。

<td class="fieldCell" id="cbfv_84"><span class="cbMailRepl" id="cbMa92357">...</span><noscript> 
This e-mail address is protected by spam bot, you must activate JavaScript in you browser in order to visualize it 
</noscript> 
</td> 
</tr> 
<tr class="sectiontableentry2 cbft_emailaddress" id="cbfr_97"> 
<td class="titleCell"><label for="cbfv_97" id="cblabcbfv_97">e-mail:</label></td> 
<td class="fieldCell" id="cbfv_97"><span class="cbMailRepl" id="cbMa92358">...</span><noscript> 
This e-mail address is protected by spam bot, you must activate JavaScript in you browser in order to visualize it 

私のJavaScriptは、私のブラウザで有効にし、このスクリーンショットから見ることができるように、それはすでにあったのであれば、私がチェック: http://prntscr.com/dwgl7w

だから私はメールを取得せずにページをダウンロードすることができますどのように「切り出し」アンチスパムボットシステムによるHTMLコードから? これも可能ですか?

+1

お使いのブラウザは、このプロトコルとは関係ありません。 このページは、最初はPythonスクリプトによってアクセスされるようには構築されていないため、このテキストは誤解を招く可能性があります。 使用しているスクリプトは、ユーザーのように行動してサイトにアクセスし、そのサイトを閲覧しています。この時点で、あなたのスクリプトは、私が推測するシンプルなcaptcha、少しjavascriptスクリプトを実行するために、特定のタスクを実行するように求められています。スクリプトはjsスクリプトを実行できないので、正しく検出されて処理されます。 –

答えて

0

メールアドレスはJavaScriptをによって生成されます enter image description here

requestsまたはurllibは、JSコードをhanldeすることはできません。セレンを使用してください。

+0

私は元の投稿で悲しいように、私はページの下部にメールを取得しているが、私はそれを上にしたい:http://prntscr.com/dwrjs7 – Steve

+0

@スティーブ私は私の答えを更新しました。 –