Kubernetesレプリケーション・コントローラ統合テストの失敗

私は統合テストはRHEL 7.2、Fedoraの24、およびCentOS7.1上で、かなり一貫して時間の約90％に失敗し、次のkubernetesを見ています：Kubernetesレプリケーション・コントローラ統合テストの失敗

test/integration/garbagecollector 
test/integration/replicationcontroller

彼らがあるように見えますetcdの失敗のために。私のオンラインクエリは、これがapiserverの問題を包含しているかもしれないと私に導きます。私の設定はシンプルですが、私はドッカーをインストール/起動し、gutubからkubernetesリポジトリを複製し、repoからhack/install-etcd.shを使用してパスに追加し、イチョウ、ゴメガ、go-bindataを取得し、テスト統合を行います。手動で何かを変更したり、カスタムファイルや設定を追加したりすることはありません。誰もがこれらの問題にぶつかり、解決策を知っていますか？私がオンラインで見たこの問題の唯一の言及は、フレークとみなされていますが、リストされた解決策はありませんが、ほぼすべてのテストを実行するごとにこの問題が発生します。エラーの小品は、必要であれば、私はより多くを与えることができ、以下の通りです：

ガベージコレクタ：

\*many lines from garbagecollector.go that look good* 

I0920 14:42:39.725768 11823 garbagecollector.go:479] create storage for resource { v1 secrets} 

I0920 14:42:39.725786 11823 garbagecollector.go:479] create storage for resource { v1 serviceaccounts} 

I0920 14:42:39.725803 11823 garbagecollector.go:479] create storage for resource { v1 services} 

I0920 14:43:09.565529 11823 trace.go:61] Trace "List *rbac.ClusterRoleList" (started 2016-09-20 14:42:39.565113203 -0400 EDT): 

[2.564µs] [2.564µs] About to list etcd node 

[30.000353492s] [30.000350928s] Etcd node listed 

[30.000361771s] [8.279µs] END 

E0920 14:43:09.566770 11823 cacher.go:258] unexpected ListAndWatch error: pkg/storage/cacher.go:198: Failed to list *rbac.RoleBinding: client: etcd cluster is unavailable or misconfigured 

\*repeats over and over with different thing failed to list*

複製コントローラー：

I0920 14:35:16.907283 10482 replication_controller.go:481] replication controller worker shutting down 

I0920 14:35:16.907293 10482 replication_controller.go:481] replication controller worker shutting down 

I0920 14:35:16.907298 10482 replication_controller.go:481] replication controller worker shutting down 

I0920 14:35:16.907303 10482 replication_controller.go:481] replication controller worker shutting down 

I0920 14:35:16.907307 10482 replication_controller.go:481] replication controller worker shutting down 

E0920 14:35:16.948417 10482 util.go:45] Metric for replication_controller already registered 

--- FAIL: TestUpdateLabelToBeAdopted (30.07s) 

replicationcontroller_test.go:270: Failed to create replication controller rc: Timeout: request did not complete within allowed duration 

E0920 14:44:06.820506 12053 storage_rbac.go:116] unable to initialize clusterroles: client: etcd cluster is unavailable or misconfigured

では/ var /ファイルはありませんでも始めることをログに記録kubeと一緒に。

ありがとうございます！

出典

2016-09-20 Johnny Bieren

あなたのマスターのetcdログは何か面白いですか？「etcdクラスタが利用できない、または構成ミスがありました」というメッセージは、あなたのetcdで何かが間違っている可能性があることを示唆しています。 –

統合テストが実行されている間、私は最終的に渡されるテストの間に次のようになります：クラスタは正常ですメンバーce2a822cea30bfcaは健全です：http://127.0.0.1:2379からの健全な結果を得ましたしかし、開始：クラスタが健全でない可能性があります：メンバの一覧に失敗しましたエラー：クライアント：etcdクラスタが利用できないか、または構成ミスが発生しましたエラー＃0：クライアント：エンドポイントhttp://127.0.0.1:2379ヘッダータイムアウトを超過しましたエラー＃ダイヤルTCP 127.0.0.1:4001：getsockopt：接続が拒否されました私はetcdctl --no-syncを実行しようとしましたが、それは役に立ちませんでした。 –

失敗したテスト中にこの出力が繰り返し検出されました： etcdserver：ファイルの80％説明するトール・リミットが使用されている[used = 886、limit = 1024] –

ファイル記述子の数の制限が増えて以来、この問題は発生していませんでした。だから先に進んでこれを解決してもらおうとします

出典

2016-09-21 15:39:18

Kubernetesレプリケーション・コントローラ統合テストの失敗

答えて

関連する問題