2016-09-23 8 views
0

私はerp(SobrusPharma)をクロールしようとしています。私はPython 3.5用のモジュールをたくさん試しましたが、誰かが私にログイン部分の解決策を教えてくれればそれが行われたクロール部分。 ログインURLは次のとおりです。Python 3.5からSobrusPharmaへのログイン

https://sobruspharma.com/auth/login

そして、クロールするページには、以下の構造をしている:、それは動的部分

https://sobruspharma.com/product/63301/table(番号の変更だ

は、事前に私をいただき、ありがとうございます。次のモジュールを試しました:

import requests 
import urllib.request 
import mechanicalSoup 

ここで助けが必要な場合は、 ありがとう!

答えて

1

それはあなたが解析する必要があるすべては、フォームからハッシュで、非常に簡単です:あなたはBS4を見つけ、残りのデータを投稿することができ

id="connex_form" 
          class=" login_form">         
<input type="hidden" name="hash" value="e60f5fef37fe07b0b516d71666071316" id="hash">  

post = "https://sobruspharma.com/auth/login" 
form_data = {"hash": "", 
      "email": "[email protected]", 
      "password": "foo", 
      "remember_me": "0", 
      "submit": "To log in"} 

from bs4 import BeautifulSoup 
from requests import Session 

with Session() as s: 
    soup = BeautifulSoup(s.get("https://sobruspharma.com/auth/login").content) 
    hash_ = soup.select_one("#hash")["value"] 
    form_data["hash"] = hash_ 
    login = s.post(post, data=form_data) 
+0

だから、ハッシュはブラウザごとに異なります!ああ、神、それは問題だった、ハッシュはすべてのセッションで同じではない? –

+0

パドレイクカニンガムありがとうございました!素晴らしい助け! –

+0

@ NabilBennani、あなたがページを訪れるたびに、ハッシュはかなり異なっているはずです。 –

関連する問題