0
ブラウザのpdfビューアページを調べると、HTML構造がありますが、urllib2と要求の両方が返されず、BS4は無限ループに入ります。ブラウザのPDFビューアのHTMLを取得することは可能ですか?
私はちょうどページのタイトルを(頭の中に)欲しいです。
例のページ:あなたがMozillaのpdf.jsを使用している場合 http://victoria.lviv.ua/html/fl5/NaturalLanguageProcessingWithPython.pdf
を行うことができるはず私は現在使用していますPython。 headタグからタイトルを取得したいと思っていましたが、html構造体を取得できないようです。私はPDF.jsに慣れていません。 – arm93