私は統合テストはRHEL 7.2、Fedoraの24、およびCentOS7.1上で、かなり一貫して時間の約90%に失敗し、次のkubernetesを見ています:Kubernetesレプリケーション・コントローラ統合テストの失敗
test/integration/garbagecollector
test/integration/replicationcontroller
彼らがあるように見えますetcdの失敗のために。私のオンラインクエリは、これがapiserverの問題を包含しているかもしれないと私に導きます。私の設定はシンプルですが、私はドッカーをインストール/起動し、gutubからkubernetesリポジトリを複製し、repoからhack/install-etcd.shを使用してパスに追加し、イチョウ、ゴメガ、go-bindataを取得し、テスト統合を行います。手動で何かを変更したり、カスタムファイルや設定を追加したりすることはありません。誰もがこれらの問題にぶつかり、解決策を知っていますか?私がオンラインで見たこの問題の唯一の言及は、フレークとみなされていますが、リストされた解決策はありませんが、ほぼすべてのテストを実行するごとにこの問題が発生します。エラーの小品は、必要であれば、私はより多くを与えることができ、以下の通りです:
ガベージコレクタ:
\*many lines from garbagecollector.go that look good*
I0920 14:42:39.725768 11823 garbagecollector.go:479] create storage for resource { v1 secrets}
I0920 14:42:39.725786 11823 garbagecollector.go:479] create storage for resource { v1 serviceaccounts}
I0920 14:42:39.725803 11823 garbagecollector.go:479] create storage for resource { v1 services}
I0920 14:43:09.565529 11823 trace.go:61] Trace "List *rbac.ClusterRoleList" (started 2016-09-20 14:42:39.565113203 -0400 EDT):
[2.564µs] [2.564µs] About to list etcd node
[30.000353492s] [30.000350928s] Etcd node listed
[30.000361771s] [8.279µs] END
E0920 14:43:09.566770 11823 cacher.go:258] unexpected ListAndWatch error: pkg/storage/cacher.go:198: Failed to list *rbac.RoleBinding: client: etcd cluster is unavailable or misconfigured
\*repeats over and over with different thing failed to list*
複製コントローラー:
I0920 14:35:16.907283 10482 replication_controller.go:481] replication controller worker shutting down
I0920 14:35:16.907293 10482 replication_controller.go:481] replication controller worker shutting down
I0920 14:35:16.907298 10482 replication_controller.go:481] replication controller worker shutting down
I0920 14:35:16.907303 10482 replication_controller.go:481] replication controller worker shutting down
I0920 14:35:16.907307 10482 replication_controller.go:481] replication controller worker shutting down
E0920 14:35:16.948417 10482 util.go:45] Metric for replication_controller already registered
--- FAIL: TestUpdateLabelToBeAdopted (30.07s)
replicationcontroller_test.go:270: Failed to create replication controller rc: Timeout: request did not complete within allowed duration
E0920 14:44:06.820506 12053 storage_rbac.go:116] unable to initialize clusterroles: client: etcd cluster is unavailable or misconfigured
では/ var /ファイルはありませんでも始めることをログに記録kubeと一緒に。
ありがとうございます!
あなたのマスターのetcdログは何か面白いですか? 「etcdクラスタが利用できない、または構成ミスがありました」というメッセージは、あなたのetcdで何かが間違っている可能性があることを示唆しています。 –
統合テストが実行されている間、私は最終的に渡されるテストの間に次のようになります: クラスタは正常です メンバーce2a822cea30bfcaは健全です:http://127.0.0.1:2379からの健全な結果を得ました しかし、開始: クラスタが健全でない可能性があります:メンバの一覧に失敗しました エラー:クライアント:etcdクラスタが利用できないか、または構成ミスが発生しました エラー#0:クライアント:エンドポイントhttp://127.0.0.1:2379ヘッダータイムアウトを超過しました エラー#ダイヤルTCP 127.0.0.1:4001:getsockopt:接続が拒否されました 私はetcdctl --no-syncを実行しようとしましたが、それは役に立ちませんでした。 –
失敗したテスト中にこの出力が繰り返し検出されました: etcdserver:ファイルの80%説明するトール・リミットが使用されている[used = 886、limit = 1024] –