2012-03-07 4 views
0

私はhtmlページからファイルをダウンロードしています。私は、HTMLページを解析し、そのページ内のリンクを見つける例Pythonでxlsファイルをダウンロードする方法は?

html = 'www.abcd.com' 

ため

今、私はhtmlページからのリンクを持っています。ただし、リンクは次の形式になっています。

i/ma/$File/ABCD.xls 

ですが、$ファイルのため、ファイルをダウンロードできません。
このような内部リンクを持つファイルをダウンロードする方法は何ですか?

おかげ

答えて

1

あなたはurlparse.urljoin()を使用してホスト名と相対パスから完全なURLを作成することができます。

+0

私はそれを知っていますが、内側のリンクに入っている$ Fileについて質問しています。それは正しいURLであることを許さない。その場合、私たちは何ができますか? – sam

+2

@sam:$ファイルの部分は、リンクのダウンロードをどのように停止しますか? urllibは$でURLを構築することを拒否していますか? –

+0

@paul:それは拒否しませんが、ダウンロードされた.xlsファイルは元の.xlsと同じではありません。 1つの列のみが入力されました – sam

関連する問題