私たちの設定は、Debian lennyの標準のnginx(ver 0.7.59)+上層サーバです。今、我々はweb/appと1 db boxのための1つの牛の箱にいる。最近、私たちは、細かいことが最終的に「ぶら下がり」することに気付きました。つまり、彼らはもはやnginxからのリクエストを受け取らなくなります。我々は15の細い線を走らせており、10-15分後に最初の1つまたは2つがぶら下がります。一日中放置されていれば、同じくらいの数に加えてさらに数回は掛かったままになります。これまでに私が見た唯一の修正は、nginxを再起動することです。再起動後、ハングしたシンがリクエストを直ちに受信し始めます。このため、それらの細かい部分が上流のプールから取り出されたように見えます。Nginxアップストリームサーバをプールから削除する
nginxがバックエンドサーバーと10秒以内に3回「通信」できない場合、既定値(われわれの既定値)を正しく理解していれば、アップストリームサーバーを "動作不能 "状態になる。その後、10秒間待ってから、そのサーバーを再試行します。それは理にかなっていますが、薄いハングが無期限に見られています。私はそれぞれの細かい点についてmax_failsを0に設定しようとしましたが、それは助けになりませんでした。上流のサーバーが永久的に「不稼動」になる原因を突き止めることはできません。
最近、急激な成長率の上昇が見られたため、それが関連するかどうかは不明ですし、短期間でより多くのトラフィックが発生したことからも明らかです。
nginxにはサーバーが完全にプールから外れてしまう何か(変更可能な指示文やその他の条件)がありますか?
うん我々の前にいることがわかるのだと私たちは(公正プロキシバランサプラグインを使用して言及するのを忘れhttp://brainspl.at/articles/2007/11/09/a-fair- proxy-balancer-for-nginx-and-mongrel; http://wiki.nginx.org/NginxHttpUpstreamFairModule)は、ラウンドロビンの代わりに最低ビジーアルゴを使用します。それはうまく動作し、#要求/シンは時間の経過とともにも非常に近いです。 私はちょうどnginxからの要求をもはや受け取らないようにしている原因を突き止めることができたら、HAProxyのような別のレイヤーを導入する必要はないと思っていました。 nginx-ey-balancerは、基本的にHAProxyを必要とするHAProxyのmaxconn algoを模倣していますか? –
はい、nginx-ey-balancerは、HAProxyを必要とするHAProxyのmaxconn algoを模倣します。私たちが最初にhaproxyに切り替えた理由のほとんどは、今や私たちのアーキテクチャーの一部になっています。 –
あなたの助けに感謝します。 nginx-ey-balancerを試してみると思います。 nginx v 0.6.34/35と0.8.0用のパッチしかありません。どちらかが0.7.59に一致し、どちらが最善か期待しているか、0.8.xが安定するまで待ちます。 –