httpsウェブサイト(Salesforce)からウェブページのPDFを生成しようとしています。 私は今までsimple_salesforceを使ってみましたが、これはセッションID(クッキー)を返していません。pdfkitを使用してログインが必要なhttpsウェブページのPDFを作成
from simple_salesforce import Salesforce
import pdfkit
sf = Salesforce(username='my username'
,password='my password'
,security_token= 'my API security token')
path_wkthmltopdf = r'C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe'
config = pdfkit.configuration(wkhtmltopdf=bytes(path_wkthmltopdf, 'utf8'))
options1 = {
'page-size': None,
'margin-top': None,
'margin-right': None,
'margin-bottom': None,
'margin-left': None,
'encoding': None,
'custom-header' : None,
'cookie': sf.session_id,
'no-outline': None
}
pdfkit.from_url('https://thiess.my.salesforce.com/0069000000IZH71','out.pdf',
configuration=config, options=options1)
誰でも、cookie引数をpdfkitに渡す最も良い方法は何ですか?
スクリプトにはいくつかのタイプミスがありますが、それらを修正した後では問題はありませんが、ちょっとしたことです。どうやら、request.get呼び出しから生成されたhtml形式は、Webページのレイアウトを歪めていたので、内容はそこにありましたが、外観は全く異なります。ページの外観をよりよく保つ他のフォーマットについて知っていますか? –
次に、同じ方法を使用しますが、BeautifulSoupを使用してください。 –
美しいスープは、pdfkitに渡されたときにpdfkitと同じ問題が発生して、それ自体で認証プロセスを処理しようとしていないイメージへのリンクを返します。 –