2012-02-06 3 views
1

私はネットワークプログラミングの初心者ですので、間違いをお許しください。httpパケットの束から単一のウェブサイトURLを取得しますか?

私は単純なスニッファを作成しています。ユーザーが要求したウェブサイトのURLだけを検出する必要があります。私はpcap.netを使用しており、httpパケット(tcpポート80フィルタ付き)を取得し、そこからデータを取得することができます。私ができないことは、要求のための単一のURIを取得して、多くのhttpパケットが来るようにすることです。

例えば、 1(ブラウザから)ユーザ要求www.website.com 2.多くのHTTP応答はwww.website.com 3 www.websiteのテキスト/ HTMLで一方が、来.comには他のhtmlページからのリソースが含まれているので、他のホストからの他の多くのパケットが来ています。

リソースからのパケットを無視する方法はありますか?いくつかのtcpセッションの再構築が必要ですか?私は2日間はグーグルで遊んでいましたが、役に立たなかったので、助けてください。

答えて

0

他のホストからのHTTP応答は、要求が送信されたIPではなく、異なるIPから来た可能性があるため、識別できます。

IPとTCPポートだけを調べるだけで、完全なTCP再構築を行わなくても、HTTP要求と応答を一致させることができます。

ただし、同じTCPセッションで複数のHTTP要求がある場合は、TCP再構成を実行してさまざまな要求と応答を分離する必要があります。

関連する問題