2016-09-20 12 views
1

私は統合テストはRHEL 7.2、Fedoraの24、およびCentOS7.1上で、かなり一貫して時間の約90%に失敗し、次のkubernetesを見ています:Kubernetesレプリケーション・コントローラ統合テストの失敗

test/integration/garbagecollector 
test/integration/replicationcontroller 

彼らがあるように見えますetcdの失敗のために。私のオンラインクエリは、これがapiserverの問題を包含しているかもしれないと私に導きます。私の設定はシンプルですが、私はドッカーをインストール/起動し、gutubからkubernetesリポジトリを複製し、repoからhack/install-etcd.shを使用してパスに追加し、イチョウ、ゴメガ、go-bindataを取得し、テスト統合を行います。手動で何かを変更したり、カスタムファイルや設定を追加したりすることはありません。誰もがこれらの問題にぶつかり、解決策を知っていますか?私がオンラインで見たこの問題の唯一の言及は、フレークとみなされていますが、リストされた解決策はありませんが、ほぼすべてのテストを実行するごとにこの問題が発生します。エラーの小品は、必要であれば、私はより多くを与えることができ、以下の通りです:

ガベージコレクタ:

\*many lines from garbagecollector.go that look good* 

I0920 14:42:39.725768 11823 garbagecollector.go:479] create storage for resource { v1 secrets} 

I0920 14:42:39.725786 11823 garbagecollector.go:479] create storage for resource { v1 serviceaccounts} 

I0920 14:42:39.725803 11823 garbagecollector.go:479] create storage for resource { v1 services} 

I0920 14:43:09.565529 11823 trace.go:61] Trace "List *rbac.ClusterRoleList" (started 2016-09-20 14:42:39.565113203 -0400 EDT): 

[2.564µs] [2.564µs] About to list etcd node 

[30.000353492s] [30.000350928s] Etcd node listed 

[30.000361771s] [8.279µs] END 

E0920 14:43:09.566770 11823 cacher.go:258] unexpected ListAndWatch error: pkg/storage/cacher.go:198: Failed to list *rbac.RoleBinding: client: etcd cluster is unavailable or misconfigured 

\*repeats over and over with different thing failed to list* 

複製コントローラー:

I0920 14:35:16.907283 10482 replication_controller.go:481] replication controller worker shutting down 

I0920 14:35:16.907293 10482 replication_controller.go:481] replication controller worker shutting down 

I0920 14:35:16.907298 10482 replication_controller.go:481] replication controller worker shutting down 

I0920 14:35:16.907303 10482 replication_controller.go:481] replication controller worker shutting down 

I0920 14:35:16.907307 10482 replication_controller.go:481] replication controller worker shutting down 

E0920 14:35:16.948417 10482 util.go:45] Metric for replication_controller already registered 

--- FAIL: TestUpdateLabelToBeAdopted (30.07s) 

replicationcontroller_test.go:270: Failed to create replication controller rc: Timeout: request did not complete within allowed duration 

E0920 14:44:06.820506 12053 storage_rbac.go:116] unable to initialize clusterroles: client: etcd cluster is unavailable or misconfigured 

では/ var /ファイルはありませんでも始めることをログに記録kubeと一緒に。

ありがとうございます!

+1

あなたのマスターのetcdログは何か面白いですか? 「etcdクラスタが利用できない、または構成ミスがありました」というメッセージは、あなたのetcdで何かが間違っている可能性があることを示唆しています。 –

+0

統合テストが実行されている間、私は最終的に渡されるテストの間に次のようになります: クラスタは正常です メンバーce2a822cea30bfcaは健全です:http://127.0.0.1:2379からの健全な結果を得ました しかし、開始: クラスタが健全でない可能性があります:メンバの一覧に失敗しました エラー:クライアント:etcdクラスタが利用できないか、または構成ミスが発生しました エラー#0:クライアント:エンドポイントhttp://127.0.0.1:2379ヘッダータイムアウトを超過しました エラー#ダイヤルTCP 127.0.0.1:4001:getsockopt:接続が拒否されました 私はetcdctl --no-syncを実行しようとしましたが、それは役に立ちませんでした。 –

+0

失敗したテスト中にこの出力が繰り返し検出されました: etcdserver:ファイルの80%説明するトール・リミットが使用されている[used = 886、limit = 1024] –

答えて

0

ファイル記述子の数の制限が増えて以来、この問題は発生していませんでした。だから先に進んでこれを解決してもらおうとします