2016-12-10 10 views
0

wgetを使用していくつかのURLをダウンロードしようとしています。私はこのリンクOffensive-Security-ICQとwww.offensive-security.com上の他のリンクを除いて問題なくファイルを取得します。wgetで不快なセキュリティファイルの内容を読むことができません

LinuxとWindowsの両方で、多くの試行錯誤を繰り返して試しましたが、無駄です。

私は、このコマンドを使用する「wgetのhttps://www.offensive-security.com/pwbonline/icq.htmlは」

ザ・結果ファイルには、このシンボルを示し、それはANSIがenter image description here

どのように私はこの問題を解決することができデコードある??

+0

あなたは、ダウンロードに失敗したと思わせる何か?これはちょうどあなたがダウンロードしたファイルの内容かもしれません...ああ、無用のスクリーンショットを掲示するのを避けてください、これは追加情報を提供せず、さらに多くの費用がかかります(ディスクスペース、ネットワーク...) – kebs

+0

質問を編集して貼り付けてくださいそのファイルを取得するために使用した正確なコマンドライン。助けることができます。 – kebs

+0

質問を編集しました。 –

答えて

1

サーバーは何らかの理由でhtmlページを返しませんが、圧縮されたバージョンです。あなたが入手するファイルは、gzipで圧縮されたデータとして識別されます:

$ file icq.html 
icq.html: gzip compressed data, from Unix 

したがって、単純に解凍して正しいhtmlページを取得することができます。

なぜサーバーがそれをしているのですか。わかりませんが、それはそのままの状態でそのまま残っているため、より速くダウンロードできます。

どのようにしてHTMLコンテンツを直接ダウンロードできますか?おそらく、一般的なユーザーエージェントとヘッダーを送信して、サーバーがダウンロードツールの代わりに要求を行っている一般的なWebブラウザだと思うようにします。

これは、いくつかのオプションを使用してwgetで行うことができ、例えば、これは動作するはずです:

wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" https://www.offensive-security.com/pwbonline/icq.html 
+0

ありがとうございます。どちらのソリューションもうまくいきました。よろしく。 –

関連する問題