2017-06-02 3 views
-1

10個のawsインスタンスを持つヘビキャストクラスタが組み込まれています。 hazelcastのバージョンは3.7.3今、私たちは、上記の設定からhazelcast別にHazelcast:クラスタ内の一時的なネットワークグリッチを持つノードのチューニングプロパティ

hazelcast.max.no.heartbeat.seconds=30 
hazelcast.max.no.master.confirmation.seconds=150     
hazelcast.heartbeat.interval.seconds=1 
hazelcast.operation.call.timeout.millis=5000 
hazelcast.merge.first.run.delay.seconds=60 

のための他のプロパティ値を設定し、次のしているされているデフォルトです。

最近、ノードの1つに数分間アクセスすることができず、キャッシュから物事を得る際に操作の一部が遅くなりました。私たちは各マップをバックアップしています。ある区画から物事が入手できない場合、ハジエルキャストは別の区画から応答しているはずですが、1つのノードが到達できないためにすべてが遅くなっているようです。

以下は、ヘイルキャストのログで見たこと以外は例外です。

[3.7.2] operation-heartbeat-timeoutへの のため、PartitionIteratingOperation呼び出しを完了できませんでした。現在の時間:2017-05-30 16:12:52.442 合計経過時間:10825ミリ秒。最後の操作ハートビート:決して。最後 メンバーからのハートビート:2017-05-30 16:12:42.166。 呼び出し{op = com.hazelcast.spi.impl.operationservice.impl.operations.PartitionIteratingOperation {serviceName = 'hz:impl:mapService'、 identityHash = 1798676695、partitionId = -1、replicaIndex = 0、callId = 0、 callTimeout = 5000、 operationFactory = [email protected]ab7}、tryCount = 10、tryPauseMillis = 300、invokeCount = 1、 callTimeoutMillis = 5000、firstInvocationTimeMs = 1496160761617、 firstInvocationTime = '2017年5月30日16:12:41.617'、lastHeartbeatMillis = 0、 lastHeartbeatTime = '1970-01-01 00:00:00.000' 、 target = [172.18.84.36]:9123、pendingResponse = {VOID}、 backupsAcksExpected = 0、backu psAcksReceived = 0、 connection =接続[id = 12、/172.18.64.219:9123->/172.18.84.36:48180,エンドポイント= [172.18.84.36]:9123、生きている= true、タイプ=メンバー}}

誰かがヘビキャストの正しい設定であることを提案して、一時的に到達可能なノードがクラスタ全体を減速させないようにすることはできますか?

答えて

0

オペレーションコールタイムアウトを低い値に設定しないでください。おそらく、デフォルト値のままにしておくことをお勧めします。ハートビートのような内部メカニズムの中には、コールタイムアウトに依存しているものがあります。

+0

はい、5秒に設定されています。しかし、どうすれば、メイン・パーティションが少し遅い場合でも、get要求が複数のバックアップ・パーティションからデータを取得するかどうかを確認できますか? –

+0

デフォルトのままにしておきます。そうでなければ上記の問題が発生します。 – pveentjer

関連する問題