AWSで多数のEC2インスタンスを実行する大規模なWebベースのアプリケーションを使用しています。ときには週に2〜3回程度 - 私のインスタンスの1つが100%CPUに達したことを通知する私のSensu監視システムからのアラーム通知を受け取ります。AWS EC2のCPU使用率がIOWaitから瞬間的に100%になるのはなぜですか?
これは通知です:
CheckCPU TOTAL WARNING: total=100.0 user=0.0 nice=0.0 system=0.0 idle=25.0 iowait=100.0 irq=0.0 softirq=0.0 steal=0.0 guest=0.0
Host: my_host_name
Timestamp: 2016-09-28 13:38:57 +0000
Address: XX.XX.XX.XX
Check Name: check-cpu-usage
Command: /etc/sensu/plugins/check-cpu.rb -w 70 -c 90
Status: 1
Occurrences: 1
これは瞬間的な発生のようですし、CPUはバックダウン秒以内に正常レベルに戻ります。だからそれはあまり心配しない何かのように思えます。しかし、私はまだそれが起こっているのは不思議です。 CPUが100%IOWaitsで占められていることに注意してください。
FYI、Amazonの監視システムはこのブリップに気付かない。 13:38
でCPU & IOlevelsを示す以下の画像を参照してください興味深いことに、AWSは、このインスタンスはすぐに引退するだろうと言われますと言います。両者は関連しているかもしれませんか?