2016-05-18 9 views
1

私の初めてのBosun設定で異常な動作が発生しています。 アラートが初めて呼び出されたときにのみメールを受信して​​いるようです。 私は確かにここに..何かを誤解していますが、私の.confファイルです:Bosun:最初の通知のみが送信されています

smtpHost = ${env.BOSUN_MAIL_SERV} 
smtpUsername = ${env.BOSUN_MAIL_USER} 
smtpPassword = ${env.BOSUN_MAIL_PASS} 
emailFrom = ${env.BOSUN_MAIL_FROM} 
httpListen = :8070 
timeAndDate = 31 
stateFile = ../bosun.state 
ledisDir = ../ledis_data 
checkFrequency = 10s 
logstashElasticHosts = ${env.BOSUN_ES_HOSTS} 

notification onError { 
    email = [email protected] 
    print = true 
} 

template generic { 
    subject = Test alert 
    body = `<p>Alert: {{.Alert.Name}} triggered </p>` 
} 

alert company.errors.rate.exceeds0 { 
    template = generic 
    unknownIsNormal = true 
    runEvery = 1 
    $notes = "The rate of errors exceeds 1." 
    crit = 1 
    critNotification = onError 
} 

あなたが見ることができるように、critは常に設定されています。しかし、決して何も起こりません。 Bosunの出力は次のようなものです:

[email protected]:~/Bosun$ ./bosun-linux-amd64-0.5.0-rc3 -c company.conf 
2016/05/18 13:14:45 enabling syslog 
2016/05/18 13:14:45 info: search.go:194: Loading last datapoints from redis 
2016/05/18 13:14:45 info: search.go:201: Done 
2016/05/18 13:14:45 info: bolt.go:53: RestoreState 
2016/05/18 13:14:45 info: bolt.go:65: RestoreState done in 23.954µs 
2016/05/18 13:14:45 info: check.go:513: check alert company.errors.rate.exceeds0 start 
2016/05/18 13:14:45 info: check.go:537: check alert company.errors.rate.exceeds0 done (463.184µs): 1 crits, 0 warns, 0 unevaluated, 0 unknown 
2016/05/18 13:14:45 info: web.go:154: bosun web listening on: :8070 
2016/05/18 13:14:45 info: web.go:155: tsdb host: 
2016/05/18 13:14:45 info: alertRunner.go:55: runHistory on company.errors.rate.exceeds0 took 11.525239ms 
2016/05/18 13:14:55 info: check.go:513: check alert company.errors.rate.exceeds0 start 
2016/05/18 13:14:55 info: check.go:537: check alert company.errors.rate.exceeds0 done (418.716µs): 1 crits, 0 warns, 0 unevaluated, 0 unknown 
2016/05/18 13:14:55 info: alertRunner.go:55: runHistory on company.errors.rate.exceeds0 took 2.298315ms 

2016/05/18 13:15:05 info: notify.go:147: Batching and sending unknown notifications 
2016/05/18 13:15:05 info: notify.go:177: Done sending unknown notifications 
2016/05/18 13:15:05 info: check.go:513: check alert company.errors.rate.exceeds0 start 
2016/05/18 13:15:05 info: check.go:537: check alert company.errors.rate.exceeds0 done (380.23µs): 1 crits, 0 warns, 0 unevaluated, 0 unknown 
2016/05/18 13:15:05 info: alertRunner.go:55: runHistory on company.errors.rate.exceeds0 took 919.933µs 
2016/05/18 13:15:15 info: check.go:513: check alert company.errors.rate.exceeds0 start 
2016/05/18 13:15:15 info: check.go:537: check alert company.errors.rate.exceeds0 done (351.148µs): 1 crits, 0 warns, 0 unevaluated, 0 unknown 
2016/05/18 13:15:15 info: alertRunner.go:55: runHistory on company.errors.rate.exceeds0 took 807.104µs 
2016/05/18 13:15:25 info: notify.go:147: Batching and sending unknown notifications 
2016/05/18 13:15:25 info: notify.go:177: Done sending unknown notifications 
2016/05/18 13:15:25 info: check.go:513: check alert company.errors.rate.exceeds0 start 
2016/05/18 13:15:25 info: check.go:537: check alert company.errors.rate.exceeds0 done (439.26µs): 1 crits, 0 warns, 0 unevaluated, 0 unknown 
2016/05/18 13:15:25 info: alertRunner.go:55: runHistory on company.errors.rate.exceeds0 took 2.429369ms 

アラートはクリティカルな状態になっていますが、通知は送信されません。私は​​にアラート名を変更した場合 ただし、通知が発射されるとメールが届いた:

[email protected]:~/Bosun$ ./bosun-linux-amd64-0.5.0-rc3 -c company.conf 
2016/05/18 13:18:35 enabling syslog 
2016/05/18 13:18:35 info: search.go:194: Loading last datapoints from redis 
2016/05/18 13:18:35 info: search.go:201: Done 
2016/05/18 13:18:35 info: bolt.go:53: RestoreState 
2016/05/18 13:18:35 info: bolt.go:65: RestoreState done in 28.431µs 
2016/05/18 13:18:35 info: check.go:513: check alert company.errors.rate.exceeds_newname start 
2016/05/18 13:18:35 info: check.go:537: check alert company.errors.rate.exceeds_newname done (638.843µs): 1 crits, 0 warns, 0 unevaluated, 0 unknown 
2016/05/18 13:18:35 info: web.go:154: bosun web listening on: :8070 
2016/05/18 13:18:35 info: web.go:155: tsdb host: 
2016/05/18 13:18:35 info: alertRunner.go:55: runHistory on company.errors.rate.exceeds_newname took 2.380886ms 
2016/05/18 13:18:35 info: notify.go:57: Test alert 
2016/05/18 13:18:36 info: notify.go:115: relayed alert company.errors.rate.exceeds_newname{} to [[email protected]] sucessfully. Subject: 10 bytes. Body: 99 bytes. 
2016/05/18 13:18:45 info: check.go:513: check alert company.errors.rate.exceeds_newname start 
2016/05/18 13:18:45 info: check.go:537: check alert company.errors.rate.exceeds_newname done (558.396µs): 1 crits, 0 warns, 0 unevaluated, 0 unknown 
2016/05/18 13:18:45 info: alertRunner.go:55: runHistory on company.errors.rate.exceeds_newname took 746.837µs 
2016/05/18 13:18:55 info: notify.go:147: Batching and sending unknown notifications 
2016/05/18 13:18:55 info: notify.go:177: Done sending unknown notifications 
2016/05/18 13:18:55 info: check.go:513: check alert company.errors.rate.exceeds_newname start 
2016/05/18 13:18:55 info: check.go:537: check alert company.errors.rate.exceeds_newname done (394.645µs): 1 crits, 0 warns, 0 unevaluated, 0 unknown 
2016/05/18 13:18:55 info: alertRunner.go:55: runHistory on company.errors.rate.exceeds_newname took 956.957µs 
2016/05/18 13:19:05 info: check.go:513: check alert company.errors.rate.exceeds_newname start 
2016/05/18 13:19:05 info: check.go:537: check alert company.errors.rate.exceeds_newname done (404.464µs): 1 crits, 0 warns, 0 unevaluated, 0 unknown 
2016/05/18 13:19:05 info: alertRunner.go:55: runHistory on company.errors.rate.exceeds_newname took 832.393µs 
2016/05/18 13:19:15 info: notify.go:147: Batching and sending unknown notifications 

通知は唯一の「新しい」アラートで明らかに送信されています。ボスンの仕組みは?誰かがそれを確認するまで通知を再送信する必要がありますか?

メールサーバーはGmailです。

ありがとうございます!

答えて

2

はい、Bosunは、警告が標準から警告に、または警告から危険に遷移したときにのみ通知を送信します。しかし通知を連鎖させたり、指定したりすることもできます

notification onError { 
    email = [email protected] 
    print = true 
    timeout = 1m 
    next = onError 
} 

このようにして、アラートが受信されるまで毎分通知が送信されます。

+0

こんにちはelementai、あなたの答えをありがとう!私は次のことを知っていて、私のために働いています。しかし、私がcrit = 0を変更し、1時間後に1に戻すと、新しい警告は到着しません。これは予想される動作ですか? – elkarel

+1

elementaiのあるPMの後にOKして、そのアラートの別の通知を受け取る場合は、最初の通知を閉じる必要があることがわかります。だから常にそれらの警報男の子を閉じてください! – elkarel

+0

また、ノーマル - >不明、警告 - >不明、不明 - >不明の場合は通知を受け取ります。したがって、それは事件の生涯における最大の重症度がいつ増加するかを通知する。 –

関連する問題