Hazelcast：クラスタ内の一時的なネットワークグリッチを持つノードのチューニングプロパティ

-1

10個のawsインスタンスを持つヘビキャストクラスタが組み込まれています。 hazelcastのバージョンは3.7.3今、私たちは、上記の設定からhazelcast別にHazelcast：クラスタ内の一時的なネットワークグリッチを持つノードのチューニングプロパティ

hazelcast.max.no.heartbeat.seconds=30 
hazelcast.max.no.master.confirmation.seconds=150     
hazelcast.heartbeat.interval.seconds=1 
hazelcast.operation.call.timeout.millis=5000 
hazelcast.merge.first.run.delay.seconds=60

のための他のプロパティ値を設定し、次のしているされているデフォルトです。

最近、ノードの1つに数分間アクセスすることができず、キャッシュから物事を得る際に操作の一部が遅くなりました。私たちは各マップをバックアップしています。ある区画から物事が入手できない場合、ハジエルキャストは別の区画から応答しているはずですが、1つのノードが到達できないためにすべてが遅くなっているようです。

以下は、ヘイルキャストのログで見たこと以外は例外です。

[3.7.2] operation-heartbeat-timeoutへののため、PartitionIteratingOperation呼び出しを完了できませんでした。現在の時間：2017-05-30 16：12：52.442 合計経過時間：10825ミリ秒。最後の操作ハートビート：決して。最後メンバーからのハートビート：2017-05-30 16：12：42.166。呼び出し{op = com.hazelcast.spi.impl.operationservice.impl.operations.PartitionIteratingOperation {serviceName = 'hz：impl：mapService'、 identityHash = 1798676695、partitionId = -1、replicaIndex = 0、callId = 0、 callTimeout = 5000、 operationFactory = [email protected]ab7}、tryCount = 10、tryPauseMillis = 300、invokeCount = 1、 callTimeoutMillis = 5000、firstInvocationTimeMs = 1496160761617、 firstInvocationTime = '2017年5月30日16：12：41.617'、lastHeartbeatMillis = 0、 lastHeartbeatTime = '1970-01-01 00：00：00.000' 、 target = [172.18.84.36]：9123、pendingResponse = {VOID}、 backupsAcksExpected = 0、backu psAcksReceived = 0、 connection =接続[id = 12、/172.18.64.219:9123->/172.18.84.36:48180,エンドポイント= [172.18.84.36]：9123、生きている= true、タイプ=メンバー}}

誰かがヘビキャストの正しい設定であることを提案して、一時的に到達可能なノードがクラスタ全体を減速させないようにすることはできますか？

出典

2017-06-02 Sameer Shah