私はscrapperを開発しており、.pdf
ファイルをページからダウンロードする必要があります。 htmlタグからファイル名を取得できますが、ファイルをダウンロードする完全なURL(または要求本文)が見つかりません。ファイルをダウンロードするURLはどのようにして見つけることができますか?
私は、クロムとFirefoxのネットワークトラフィックツールとwiresharkを使ってトラフィックをスニッフィングしようとしましたが、成功しませんでした。私はそれがページ自体とまったく同じURLへの投稿要求をするのを見ることができるので、なぜこのようなことが起こるのか理解できません。私の推測では、ファイル名はPOSTリクエスト本体の中に送られているのですが、それらのツールでもその情報を見つけることはできません。本文に変数名が表示されていれば、要求のコピーを作成してファイルを取得できます。
これらの情報はどのように入手できますか?ここで
EDIT:似た何かを求める人のために、このウェブサイトを見てみましょう:http://curl.trillworks.com/
それはPythonの要求コードにカールを変換します。非常に便利です
ありがとう、私はこれを試してみます。このharファイルを使用して、PostManまたは一部の同様のソフトウェアに対する投稿リクエストを作成できますか? –
あなたはそれらの行に沿って何かをすることができるようです。この議論を参照してください:https://github.com/postmanlabs/postman-app-support/issues/86 –
ええ、私はちょうどその周りにグーグルで同じ問題を発見した。ありがとう! –