1

Azure SFテスト環境を作成するために、デベロッパーテストラボ内にAzure VMを3つ作成しました。これらはX509で保護されます。 サービスファブリックMultiNode X509クラスタ - インストーラサービスが完了するのを待ってタイムアウトしました

  • すべてのファイアウォールが無効になっている同じ仮想ネットワーク上で

    • のWindows 2016データセンター
    • (から各マシンにpingを実行できます:

      私はマシンがある情報Here & Here

      を使用しましたその他)

    • すべて同じ管理者アカウントを使用しています

    マニュアルで提供されているcertsetup.ps1ファイルを使用して自己署名証明書を作成しました。サーバー&の証明書が1つの推奨として組み合わされています。

    TestConfiguration.ps1を実行すると、次の出力が表示されます。

    LocalAdminPrivilege  : True 
    IsJsonValid    : True 
    IsCabValid     : 
    RequiredPortsOpen   : True 
    RemoteRegistryAvailable : True 
    FirewallAvailable   : True 
    RpcCheckPassed    : True 
    NoConflictingInstallations : True 
    FabricInstallable   : True 
    DataDrivesAvailable  : True 
    Passed      : True 
    

    明らかに、IsCabValidフィールドは空白ですが、「Passed」フィールドは引き続きインストールが可能であることを示しています。私は次のpowershellコマンドを実行してインストールを開始します。

    。\ CreateServiceFabricCluster.ps1 -ClusterConfigFilePath 。\ ClusterConfig.X509.MultiMachine.json

    上記のコマンドに続いて、プロセスが起動し、コンソールウィンドウを示唆して次のテキストが取り込まれノード間の通信は正常である..

    Creating Service Fabric Cluster... 
    If it's taking too long, please check in Task Manager details and see if Fabric.exe for each node is running. If not, please look at: 1. traces in DeploymentTraces directory and 2. traces in FabricLogRoot configured in ClusterConfig.json. 
    Trace folder already exists. Traces will be written to existing trace folder: C:\StandaloneCluster\DeploymentTraces 
    Running Best Practices Analyzer... 
    Best Practices Analyzer completed successfully. 
    Creating Service Fabric Cluster... 
    Processing and validating cluster config. 
    Configuring nodes. 
    Default installation directory chosen based on system drive of machine '10.0.0.4'. 
    Copying installer to all machines. 
    Configuring machine '10.0.0.4'. 
    Configuring machine '10.0.0.5'. 
    Configuring machine '10.0.0.6'. 
    Machine 10.0.0.6 configured. 
    Machine 10.0.0.5 configured. 
    Machine 10.0.0.4 configured. 
    Running Fabric service installation. 
    Successfully started FabricInstallerSvc on machine 10.0.0.4 
    Successfully started FabricInstallerSvc on machine 10.0.0.6 
    Successfully started FabricInstallerSvc on machine 10.0.0.5 
    

    数分の長いポーズはタイムアウトエラーが表示されるが、理由としては実際の表示とされた後に発生します。私はノード上のウィンドウログを検索しましたが、それ以上の情報を明らかにすることはできませんでした。次のようにPSコンソールに表示されるエラーは次のとおりです。

    Timed out waiting for Installer Service to complete for machine 10.0.0.4. Investigation order: FabricInstallerService -> FabricSetup -> FabricDeployer -> Fabric 
    Timed out waiting for Installer Service to complete for machine 10.0.0.6. Investigation order: FabricInstallerService -> FabricSetup -> FabricDeployer -> Fabric 
    Timed out waiting for Installer Service to complete for machine 10.0.0.5. Investigation order: FabricInstallerService -> FabricSetup -> FabricDeployer -> Fabric 
    CreateCluster Error: System.AggregateException: One or more errors occurred. ---> System.ServiceProcess.TimeoutException: Timed out waiting for Installer Service to complete for machine 10.0.0.5. Investigation order: FabricInstallerService -> FabricSetup -> FabricDeploye 
    r -> Fabric 
        at Microsoft.ServiceFabric.DeploymentManager.DeploymentManagerInternal.StartAndValidateInstallerServiceCompletion(String machineName, ServiceController installerSvc) 
        at System.Threading.Tasks.Parallel.<>c__DisplayClass17_0`1.<ForWorker>b__1() 
        at System.Threading.Tasks.Task.InnerInvokeWithArg(Task childTask) 
        at System.Threading.Tasks.Task.<>c__DisplayClass176_0.<ExecuteSelfReplicating>b__0(Object) 
        --- End of inner exception stack trace --- 
        at System.Threading.Tasks.Task.ThrowIfExceptional(Boolean includeTaskCanceledExceptions) 
        at System.Threading.Tasks.Task.Wait(Int32 millisecondsTimeout, CancellationToken cancellationToken) 
        at System.Threading.Tasks.Parallel.ForWorker[TLocal](Int32 fromInclusive, Int32 toExclusive, ParallelOptions parallelOptions, Action`1 body, Action`2 bodyWithState, Func`4 bodyWithLocal, Func`1 localInit, Action`1 localFinally) 
        at System.Threading.Tasks.Parallel.ForEachWorker[TSource,TLocal](IEnumerable`1 source, ParallelOptions parallelOptions, Action`1 body, Action`2 bodyWithState, Action`3 bodyWithStateAndIndex, Func`4 bodyWithStateAndLocal, Func`5 bodyWithEverything, Func`1 localInit, Ac 
    tion`1 localFinally) 
        at System.Threading.Tasks.Parallel.ForEach[TSource](IEnumerable`1 source, Action`1 body) 
        at Microsoft.ServiceFabric.DeploymentManager.DeploymentManagerInternal.RunFabricServices(List`1 machines, FabricPackageType fabricPackageType) 
        at Microsoft.ServiceFabric.DeploymentManager.DeploymentManagerInternal.<CreateClusterAsyncInternal>d__7.MoveNext() 
    ---> (Inner Exception #0) System.ServiceProcess.TimeoutException: Timed out waiting for Installer Service to complete for machine 10.0.0.5. Investigation order: FabricInstallerService -> FabricSetup -> FabricDeployer -> Fabric 
        at Microsoft.ServiceFabric.DeploymentManager.DeploymentManagerInternal.StartAndValidateInstallerServiceCompletion(String machineName, ServiceController installerSvc) 
        at System.Threading.Tasks.Parallel.<>c__DisplayClass17_0`1.<ForWorker>b__1() 
        at System.Threading.Tasks.Task.InnerInvokeWithArg(Task childTask) 
        at System.Threading.Tasks.Task.<>c__DisplayClass176_0.<ExecuteSelfReplicating>b__0(Object)<--- 
    
    ---> (Inner Exception #1) System.ServiceProcess.TimeoutException: Timed out waiting for Installer Service to complete for machine 10.0.0.6. Investigation order: FabricInstallerService -> FabricSetup -> FabricDeployer -> Fabric 
        at Microsoft.ServiceFabric.DeploymentManager.DeploymentManagerInternal.StartAndValidateInstallerServiceCompletion(String machineName, ServiceController installerSvc) 
        at System.Threading.Tasks.Parallel.<>c__DisplayClass17_0`1.<ForWorker>b__1() 
        at System.Threading.Tasks.Task.InnerInvokeWithArg(Task childTask) 
        at System.Threading.Tasks.Task.<>c__DisplayClass176_0.<ExecuteSelfReplicating>b__0(Object)<--- 
    
    ---> (Inner Exception #2) System.ServiceProcess.TimeoutException: Timed out waiting for Installer Service to complete for machine 10.0.0.4. Investigation order: FabricInstallerService -> FabricSetup -> FabricDeployer -> Fabric 
        at Microsoft.ServiceFabric.DeploymentManager.DeploymentManagerInternal.StartAndValidateInstallerServiceCompletion(String machineName, ServiceController installerSvc) 
        at System.Threading.Tasks.Parallel.<>c__DisplayClass17_0`1.<ForWorker>b__1() 
        at System.Threading.Tasks.Task.InnerInvokeWithArg(Task childTask) 
        at System.Threading.Tasks.Task.<>c__DisplayClass176_0.<ExecuteSelfReplicating>b__0(Object)<--- 
    
    Trace folder already exists. Traces will be written to existing trace folder: C:\StandaloneCluster\DeploymentTraces 
    Cleaning up faulted installation. 
    Removing configuration from machine 10.0.0.5 
    Removing configuration from machine 10.0.0.4 
    Removing configuration from machine 10.0.0.6 
    

    は、AzureのSFは私が間違っているつもりどこにどのような提案を問題にいくつかの光を当てる、または提供することができます誰がそこに愛好家がありますか?

  • +0

    ここで説明するようにSDKをアンインストールしてみましたか?https://stackoverflow.com/questions/38106961/create-on-premise-service-fabric-cluster-fails-with-exception?rq=1 – Oliver

    +0

    @Oliverインストール時にSDKがマシンに存在していなかった場合は、TestConfiguration.ps1が失敗します。 – Hicki

    +0

    あなたのVMはどれくらいのサイズですか?より速いものが必要な場合や、インストーラのタイムアウトを変更する場合があります(これを行うスイッチがあると思います)。 – Mardoxx

    答えて

    0

    これは、FabricHostの起動に失敗した場合に表示される一般的な障害パターンです。これは、さまざまな理由で発生する可能性があります。

    SF VMSSデプロイメントの代わりにraw Azure VMを使用しているため、クラスタ設定NodeTypeで設定されているアップストリームポートも各マシンで開いていることを確認する必要があります。これが正しく設定されているかどうかをテストするには、これらのVM間で安全でないクラスタを先に展開してみてください。

    上記の場合、-NoCleanupOnFailureフラグを使用して展開を実行し、「アプリケーションとサービスログ> Microsoft-サービスファブリック>管理者」のイベントログに失敗したマシンの1つをチェックします。

    エラー/警告ログには、証明書の読み込みに問題があるか、その他のブロック問題があるかどうかが示されます。docに記載されている要件の1つであるため、証明書が各マシンのNETWORK SERVICEにACLされていることを確認してください。

    証明書の拇印に無効な文字が含まれていると、その他の一般的なエラーが発生します。表示された拇印に隠れた無効な文字が含まれ、設定に直接コピーすると展開の問題が発生するバグがWindows証明書管理ツールにあります。 16進エディタ(HxDなど)を使用して確認してください。設定サムプリントには有効な文字のみが含まれています。

    これで解決できない情報がある場合は、Standalone packageに含まれているTools \ Microsoft.Azure.ServiceFabric.WindowsServer.SupportPackage.zipからLog Collectorツールを実行し、収集したログをアップロードしてくださいあなたの選択したストレージに私たちのチームと共有することができます。 [email protected]へのリンクを郵送することができます。

    0

    cluster/server/reverseProxy certsの場合、1)秘密鍵の読み込み特権を 'Network Service'にACLする必要があり、2)CA証明書をTrustedRootに追加する必要があります。

    関連する問題