2016-10-22 8 views
1

私は自分のFT.comアカウントにログインし、私のためにいくつかのデータをプルダウンするスクリプトを書こうとしています。PythonのリクエストでFT.comにログイン

最初のハードルは明らかにログインしています。私はPythons Requestsライブラリを使っています。

#!/usr/bin/env python 
import requests 


# log into FT website 
log_in_url = 'https://accounts.ft.com/login' 
my_email = '[email protected]' 
my_pass = 'mypassword' 
data = {'email': my_email, 
     'password': my_pass, 
} 

with requests.Session() as session: 
    log_in_request = session.post(log_in_url, data=data) 
    # prints log-in page with error about contacting cus. service 
    print log_in_request.content 

それはちょうど戻って、ログインページに私をリダイレクトします。

は、ここに私のコードです。それは '間違った詳細'や何か(彼らは間違いなく正しい)とは言いません。それだけで私はログインできません。私は何か私のPOSTリクエストに間違っていると思う - 私はヘッダーやクッキーや何かが不足しているようです。

何が起こっているのでしょうか?あなたは、元のコンテンツをコピーまたはフィートのウェブサイトからのデータの無視できない金額をこすり場合ではないに(そのT &のCsに違反するように、あなたは間違いなく

乾杯、

ディーン

+0

私は、あなたのブラウザのWeb開発者向けツールを開くにはお勧めのヘッダー/データがログイン時に送信され、姿を確認し、必要であればどこから来たのか、リクエストでそれを再現してみてください。 – agg3l

+0

セッションオブジェクトでページに最初にアクセスしてみてください。 –

+0

これと100万点を試しました。このサイトでは何も動作していないようです。 –

答えて

2

をブロックされます著作権法に言及してください)。

FTの一部は広告によって資金提供されています。 Pythonを使用してこれらをバイパスすると、妥当な収入源が侵食されます。

私はこのスクリプトを使用して、ウォッチリストをExcelにコピーします。これは、以前はコピー/ペーストを使用していました。私はそれを分析や記事の読解に使用しません。私は、FTをブラウザー経由で読んで、公平な広告視聴トラフィックを毎日生成しています。

これを悪用しないでください。そうした場合、支払いを受けているすべての加入者がPythonで微妙なナビゲーションをしてもブロックされる可能性があります。

from robobrowser import RoboBrowser 

browser = RoboBrowser(history=True) 

url='https://accounts.ft.com/login?location=https%3A%2F%2Fwww.ft.com%2F' 

browser.open(url) 
form=browser.get_form() 
form['email']="" 
form['password']="" 
browser.session.headers['Referer'] = url 
browser.submit_form(form) 

あなたがデータマイニングを行いたいとそうであればFTデベロッパプログラムがあります: https://developer.ft.com/

+0

あなたの返信ありがとう!私は著作権法に違反したり、このスクリプトを全く共有したりするつもりはない。私の意図は、単に日刊新聞をPDF(FTがボタンとして提供)としてダウンロードし、準備ができたら自分自身に電子メールを送ることです。私はこれを打ち、それがうまくいくかどうかを見るでしょう。 –

+0

妥当と思われます。私を昇格させて質問を解決できますか?私のprivelegesは今stackoverflow上のごみです... – langbourne

+0

(それはもちろんあなたのために動作すると仮定!) – langbourne

関連する問題