2017-02-22 19 views
0

私は1つのマスターと4つのノードを持つkubernetesクラスタを持っています。 kube-proxyは4つのノードすべてで正常に動作していました。実行していた場所に関係なく、どのノードでもサービスにアクセスできました。すなわち、 http://node1:30000からhttp://node4:30000は同じ応答を示していました。kubernetesノードが再起動後に応答しない

今、それが戻って来た-r シャットダウンを実行して、ノード4を再起動した後、私は、ノードがもはや要求に応答していることに気づいていません。私は私のPCから、またはクラスタ内の他のノードから実行した場合

curl http://node4:30000 

- ノード1ノード3、またはマスターを通じて - 私が手:私は、次のコマンドを実行しています

curl: (7) Failed to connect to node4 port 30000: Connection timed out 

しかし、node4から実行すると、正常に応答します。これは、kube-proxyが正常に動作していると信じていますが、何かが外部接続を妨げていると思います。

私はkubectlは、ノードノード4を記述し実行すると、私の出力は正常になります。

Name:     node4 
Labels:     beta.kubernetes.io/arch=amd64 
         beta.kubernetes.io/os=linux 
         kubernetes.io/hostname=node4 
Taints:     <none> 
CreationTimestamp:  Tue, 21 Feb 2017 15:21:17 -0400 
Phase: 
Conditions: 
    Type     Status LastHeartbeatTime      LastTransitionTime      Reason       Message 
    ----     ------ -----------------      ------------------      ------       ------- 
    OutOfDisk    False Wed, 22 Feb 2017 08:03:40 -0400   Tue, 21 Feb 2017 15:21:18 -0400   KubeletHasSufficientDisk  kubelet has sufficient disk space available 
    MemoryPressure  False Wed, 22 Feb 2017 08:03:40 -0400   Tue, 21 Feb 2017 15:21:18 -0400   KubeletHasSufficientMemory  kubelet has sufficient memory available 
    DiskPressure   False Wed, 22 Feb 2017 08:03:40 -0400   Tue, 21 Feb 2017 15:21:18 -0400   KubeletHasNoDiskPressure  kubelet has no disk pressure 
    Ready     True Wed, 22 Feb 2017 08:03:40 -0400   Tue, 21 Feb 2017 15:21:28 -0400   KubeletReady     kubelet is posting ready status. AppArmor enabled 
Addresses:    10.6.81.64,10.6.81.64,node4 
Capacity: 
alpha.kubernetes.io/nvidia-gpu:  0 
cpu:         2 
memory:        4028748Ki 
pods:         110 
Allocatable: 
alpha.kubernetes.io/nvidia-gpu:  0 
cpu:         2 
memory:        4028748Ki 
pods:         110 
System Info: 
Machine ID:     dbc0bb6ba10acae66b1061f958220ade 
System UUID:     4229186F-AA5C-59CE-E5A2-258C1BBE9D2C 
Boot ID:      a3968e6c-eba3-498c-957f-f29283af1cff 
Kernel Version:    4.4.0-63-generic 
OS Image:      Ubuntu 16.04.1 LTS 
Operating System:    linux 
Architecture:     amd64 
Container Runtime Version:  docker://1.13.0 
Kubelet Version:    v1.5.2 
Kube-Proxy Version:   v1.5.2 
ExternalID:      node4 
Non-terminated Pods:   (27 in total) 
    Namespace      Name                 CPU Requests CPU Limits  Memory Requests Memory Limits 
    ---------      ----                 ------------ ----------  --------------- ------------- 
    << application pods listed here >> 
    kube-system     kube-proxy-0p3lj              0 (0%)   0 (0%)   0 (0%)   0 (0%) 
    kube-system     weave-net-uqmr1               20m (1%)  0 (0%)   0 (0%)   0 (0%) 
Allocated resources: 
    (Total limits may be over 100 percent, i.e., overcommitted. 
    CPU Requests CPU Limits  Memory Requests Memory Limits 
    ------------ ----------  --------------- ------------- 
    20m (1%)  0 (0%)   0 (0%)   0 (0%) 

は、私はシステムの再起動後にオンラインのノードを戻すために行う必要があり、特定のものがありますか?

+0

このクラスタをどのように展開/作成しましたか?他のノードがドッカー1.13.xも使用しているかどうか、またはそれらがまだ1.12.xにあるかどうかを確認できますか? –

答えて

0

私のチームは、ドッカーを1.12にダウングレードすることでこの問題を解決できました。問題は、この問題に関連していることが表示されます:

https://github.com/kubernetes/kubernetes/issues/40182

1.12にドッキングウィンドウをダウングレードした後、すべてが今取り組んでいます。

関連する問題