0

現在、私はPythonとソケットを使ってHTTPクライアントを実装しようとしています。それは非常に簡単で、Webサーバーからファイルをダウンロードし、それをユーザーが提供するファイルに入れるだけです。ファイルに書き込む前にHTTP応答からヘッダをソート

私のコードはうまくいきますが、ファイルからHTTP応答ヘッダーを除外する方法の問題があります。

HTTP応答ヘッダーはファイルの先頭にあるため、すべてのデータをファイルにダンプしてからヘッダーを取り出すことができます。これはI/Oが非常に遅いので問題になります。

私の次の考えは、サーバーから取得した最初の応答でRegexを実行し、ヘッダーを並べ替えて残りをファイルにダンプすることでした。これは非常に厄介な方法だと思われる。

誰でもスマートな方法でこれを行う方法に関する提案はありますか?

答えて

1

http応答では、ヘッダーは本文から隔てられ、'\r\n\r\n'です。身体だけを取得するには、これを試すことができます:

関連する問題