2016-10-20 12 views
0

私はこの問題をこの数日で見ています。 Ganglia gemtadプロセスは、SIGSEGV(segfault)の開始から5分以内に終了しますGanglia - gmetad - プロセスはSIGSEGVによって終了されています

これは過去数ヶ月以来安定していました。

Version - gmetad 3.7.1 

私はの/ var/log/messagesにまたはは/ var /のいずれかのセキュア /ログインにgmetadするために、任意のコア・ダンプまたは特定の何も表示されません。

- メモリも

free -m 
      total  used  free  shared buffers  cached 
Mem:   7989  3624  4364   0  333  2562 
-/+ buffers/cache:  728  7260 
Swap:   4095   0  4095 

私はgmetad時計& superviordプロセスフォークを持ってかなり[OK]を探します

load average: 1.97, 0.99, 0.42 

このイベントの時点で(上から)

システムスナップ

はスーパーバイザーログです

2016-10-20 14:34:55,707 INFO exited: gmetad (terminated by SIGSEGV; not expected) 
2016-10-20 14:34:55,707 INFO received SIGCLD indicating a child quit 
2016-10-20 14:34:57,712 INFO spawned: 'gmetad' with pid 24561 
2016-10-20 14:34:59,929 INFO exited: gmetad (terminated by SIGSEGV; not expected) 
2016-10-20 14:34:59,929 INFO received SIGCLD indicating a child quit 
2016-10-20 14:35:02,932 INFO spawned: 'gmetad' with pid 24593 
2016-10-20 14:35:04,897 INFO exited: gmetad (terminated by SIGSEGV; not expected) 
2016-10-20 14:35:04,897 INFO received SIGCLD indicating a child quit 
2016-10-20 14:35:08,903 INFO spawned: 'gmetad' with pid 24618 
2016-10-20 14:35:11,257 INFO exited: gmetad (terminated by SIGSEGV; not expected) 
2016-10-20 14:35:11,257 INFO received SIGCLD indicating a child quit 
2016-10-20 14:35:12,257 INFO gave up: gmetad entered FATAL state, too many start retries too quickly 

特にgmetadでこのような問題に直面した人はいますか? ポインタを理解してください。

答えて

0

問題を特定して解決できました。

いくつかの重要なステップ/発見 -

  1. 変更フォアグラウンドでgmetaaを実行し、そのやって何に詳細なログを吐き出すためにgmetad.confで> 1に「DEBUG_LEVEL」。
  2. 特定のdata_sourceの特定のノードのファイルを処理しようとしていたとき、gmetadプロセスが全く同じポイントで強制終了されていることがわかりました。
  3. gmetad.confから他のすべての 'data_source'をコメントアウトし、問題のあるdata_source->ノードを特定してみることができます。
  4. 問題のあるノードを把握した後、/ path/to/rrd/node_dir/file_with_issueまたはディレクトリ全体を削除しました。 (これがデータ損失であるため、より良い方法を見つける必要があります)
  5. debug_levelを元に戻し、gmetadを再起動してください!私の場合は

、ポイントにファイル名を固定する - 「part_max_used.rrdは、」ファイル名だったの下に/パス/に/節/ RRDS/NODE_NAMEこのことができますSIGSEGV

希望の根本的な原因でした - )

関連する問題