2016-06-22 10 views
1

実稼働環境でSFをテストして評価するために、3台のノードを持つ本番マシンに1台の(単一マシン)テストクラスタを作成しました。しかし、3つのノードを持つマルチマシンクラスタを作成できませんでした。オンプレミスのマルチマシンサービスファブリッククラスタの作成でエラーが発生しました

私は、これらの命令に続く:https://azure.microsoft.com/en-us/documentation/articles/service-fabric-cluster-creation-for-windows-server/

すべてのマシン:、10.0.10.12 10.0.11.12、10.0.12.12:

  • は(セキュア)と同じで、次のIPを持つネットワークです。
  • は仮想であり、同じ画像から新しく作成されました。
  • はドメインの一部ではありません。セットアップは、すべてのマシンで同じパスワードを持つ管理者アカウントで実行されます。
  • Windows Server 2012 R2 with PowerShell 4.0を使用する。
  • には、ファイアウォール(公開および非公開)が無効になっています。

これはclusterConfig.jsonです:私はマシン(それが10.0.10.12だった)のいずれかからのクラスタのセットアップを開始すると

{ 
    "name":"SampleCluster", 
    "clusterManifestVersion":"1.0.0", 
    "apiVersion":"2015-01-01-alpha", 
    "nodes":[ 
     { 
     "nodeName":"vm1", 
     "iPAddress":"10.0.10.12", 
     "nodeTypeRef":"NodeType0", 
     "faultDomain":"fd:/dc1/fd1", 
     "upgradeDomain":"UD0" 
     }, 
     { 
     "nodeName":"vm2", 
     "iPAddress":"10.0.11.12", 
     "nodeTypeRef":"NodeType0", 
     "faultDomain":"fd:/dc1/fd2", 
     "upgradeDomain":"UD1" 
     }, 
     { 
     "nodeName":"vm3", 
     "iPAddress":"10.0.12.12", 
     "nodeTypeRef":"NodeType0", 
     "faultDomain":"fd:/dc1/fd3", 
     "upgradeDomain":"UD2" 
     } 
    ], 
    "diagnosticsFileShare": { 
     "etlReadIntervalInMinutes": "5", 
     "uploadIntervalInMinutes": "10", 
     "dataDeletionAgeInDays": "7", 
     "etwStoreConnectionString": "file:c:\\ProgramData\\SF\\FileshareETW", 
     "crashDumpConnectionString": "file:c:\\ProgramData\\SF\\FileshareCrashDump", 
     "perfCtrConnectionString": "file:c:\\ProgramData\\SF\\FilesharePerfCtr" 
    }, 
    "properties":{ 
     "reliabilityLevel": "Bronze", 
     "nodeTypes": [ 
      { 
      "name": "NodeType0", 
      "clientConnectionEndpointPort": "19000", 
      "clusterConnectionEndpoint": "19001", 
      "httpGatewayEndpointPort": "19080", 
      "applicationPorts": { 
       "startPort": "20001", 
       "endPort": "20031" 
      }, 
      "ephemeralPorts": { 
       "startPort": "20032", 
       "endPort": "20062" 
      }, 
      "isPrimary": true 
      } 
     ], 
     "fabricSettings": [ 
     { 
      "name": "Setup", 
      "parameters": [ 
      { 
       "name": "FabricDataRoot", 
       "value": "C:\\ProgramData\\SF" 
      }, 
      { 
       "name": "FabricLogRoot", 
       "value": "C:\\ProgramData\\SF\\Log" 
      } 
      ] 
     } 
     ] 
    } 
} 

、これはPowerShellコンソールに書き込まれます。

Cab extracted. 
Creating Service Fabric Cluster... 
If it's taking too long, please check in Task Manager details and see if Fabric.exe for each node is running. If not, p 
lease look at: 1. traces in DeploymentTraces directory and 2. traces in FabricLogRoot configured in ClusterConfig.json. 
Trace folder doesn't exist. Creating trace folder: C:\copy\DeploymentTraces 
Verifying remote procedure call access against cluster machines. 
Processing and validating cluster config. 
Creating FabricSettingsMetadata from C:\copy\ServiceFabricPackage\bin\Fabric\Fabric.Code\Configurations.csv 
Configuring nodes. 
Copying installer & package to all machines. 
Configuring machine 10.0.10.12 
Configuring machine 10.0.11.12 

ここで、セットアップは数分間続きます。そして、タイムアウトが発生します。私は特定のマシン(10.0.11.12)上のサービスをチェックすると

Timed out waiting for Installer Service to start for machine 10.0.11.12. 
CreateCluster Error: System.InvalidOperationException: Cannot start service FabricInstallerSvc on computer '10.0.11.12'. 
---> System.ComponentModel.Win32Exception: The system cannot find the file specified 
    --- End of inner exception stack trace --- 
    at System.ServiceProcess.ServiceController.Start(String[] args) 
    at System.Fabric.DeploymentManager.StartAndValidateInstallerServiceCompletion(String machineName, ServiceController i 
nstallerSvc) 
    at System.Threading.Tasks.Task.Execute() 
--- End of stack trace from previous location where exception was thrown --- 
    at System.Runtime.CompilerServices.TaskAwaiter.ThrowForNonSuccess(Task task) 
    at System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(Task task) 
    at System.Fabric.DeploymentManager.<CreateClusterAsyncInternal>d__a.MoveNext() 
Errors occurred during cluster creation. 
CreateCluster Exception 0: System.AggregateException: One or more errors occurred. ---> System.InvalidOperationException 
: Cannot start service FabricInstallerSvc on computer '10.0.11.12'. ---> System.ComponentModel.Win32Exception: The syste 
m cannot find the file specified 
    --- End of inner exception stack trace --- 
    at System.ServiceProcess.ServiceController.Start(String[] args) 
    at System.Fabric.DeploymentManager.StartAndValidateInstallerServiceCompletion(String machineName, ServiceController i 
nstallerSvc) 
    at System.Threading.Tasks.Task.Execute() 
--- End of stack trace from previous location where exception was thrown --- 
    at System.Runtime.CompilerServices.TaskAwaiter.ThrowForNonSuccess(Task task) 
    at System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(Task task) 
    at System.Fabric.DeploymentManager.<CreateClusterAsyncInternal>d__a.MoveNext() 
    --- End of inner exception stack trace --- 
---> (Inner Exception #0) System.InvalidOperationException: Cannot start service FabricInstallerSvc on computer '10.0.11 
.12'. ---> System.ComponentModel.Win32Exception: The system cannot find the file specified 
    --- End of inner exception stack trace --- 
    at System.ServiceProcess.ServiceController.Start(String[] args) 
    at System.Fabric.DeploymentManager.StartAndValidateInstallerServiceCompletion(String machineName, ServiceController i 
nstallerSvc) 
    at System.Threading.Tasks.Task.Execute() 
--- End of stack trace from previous location where exception was thrown --- 
    at System.Runtime.CompilerServices.TaskAwaiter.ThrowForNonSuccess(Task task) 
    at System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(Task task) 
    at System.Fabric.DeploymentManager.<CreateClusterAsyncInternal>d__a.MoveNext()<--- 

を、私はリストにサービスファブリックインストーラサービスを見つけましたが、実行されていません。また、私は(上記のエラーメッセージに沿ったものである)、これを示すWindowsイベントログにエラーを見つけることができます:C:\はProgramData \ SF

The Service Fabric Installer Service service failed to start due to the following error: 
The system cannot find the file specified. 

を特定のマシンで、私は次のログファイルを置か\ Log \ traces \ FabricInstallerService_5.1.150.9590_131111077992093094.trace。それはこれを含んでいます:

2016-06-22 22:23:19.224,Info ,708,General.FabricInstallerServiceImpl,FabricInstallerService starting ... 
2016-06-22 22:23:19.224,Noise ,1652,[email protected],Attempting to attach child AsyncOperation 3b4480bdf0. 
2016-06-22 22:23:19.224,Noise ,1652,[email protected],Calling OnStart 
2016-06-22 22:23:19.224,Noise ,1652,[email protected],Attempting to attach child AsyncOperation 3b4480c9b0. 
2016-06-22 22:23:19.224,Noise ,1652,[email protected],Calling OnStart 
2016-06-22 22:23:19.224,Noise ,1652,[email protected],FinishComplete called with S_OK 
2016-06-22 22:23:19.224,Noise ,1652,[email protected],Attempting to attach child AsyncOperation 3b44811630. 
2016-06-22 22:23:19.224,Noise ,1652,[email protected],Calling OnStart 
2016-06-22 22:23:19.224,Noise ,1652,[email protected],FinishComplete called with S_OK 
2016-06-22 22:23:19.224,Noise ,1652,General.FabricInstallerServiceImpl,FabricUpgradeManager open returned S_OK 
2016-06-22 22:23:19.224,Noise ,1652,[email protected],Detaching child AsyncOperation 3b4480bdf0. 
2016-06-22 22:23:19.224,Noise ,1652,[email protected],Detaching child AsyncOperation 3b4480c9b0. 
2016-06-22 22:23:19.224,Info ,1652,FabricInstallerService.FabricUpgradeManager,Upgrade started with FabricDataRoot:C:\ProgramData\SF, FabricLogRoot:C:\ProgramData\SF\Log, FabricCodePath:C:\Program Files\Microsoft Service Fabric\bin\fabric\fabric.code, FabricRoot:C:\Program Files\Microsoft Service Fabric, TargetInformationFilePath:C:\ProgramData\SF\TargetInformation.xml, TargetInformationDescription:TargetInformationFileDescription { CurrentInstallation = WindowsFabricDeploymentDescription { IsValid = true, InstanceId = 0, MSILocation = , ClusterManifestLocation = , InfrastructureManifestLocation = , NodeName = , UpgradeEntryPointExe = , UpgradeEntryPointExeParameters = , UndoUpgradeEntryPointExe = FabricSetup.exe, UndoUpgradeEntryPointExeParameters = /operation:Uninstall , }TargetInstallation = WindowsFabricDeploymentDescription { IsValid = false, InstanceId = , MSILocation = , ClusterManifestLocation = , InfrastructureManifestLocation = , NodeName = , UpgradeEntryPointExe = , UpgradeEntryPointExeParameters = , UndoUpgradeEntryPointExe = , UndoUpgradeEntryPointExeParameters = , }} 
2016-06-22 22:23:19.224,Info ,1652,FabricInstallerService.FabricUpgradeManager,Stopping fabric host 
2016-06-22 22:23:19.224,Info ,1652,FabricInstallerService.FabricUpgradeManager,Error 0x80070424 while waiting for fabric host service to stop. 
2016-06-22 22:23:19.224,Error ,1652,FabricInstallerService.FabricUpgradeManager,Unable to stop fabric host service; error 
2016-06-22 22:23:19.224,Error ,1652,FabricInstallerService.FabricUpgradeManager,Error E_FAIL while trying to stop fabric host service 
2016-06-22 22:23:19.224,Noise ,1652,[email protected],FinishComplete called with E_FAIL 
2016-06-22 22:23:19.224,Warning ,1652,FabricInstallerService.FabricUpgradeManager,Upgrade finished with error E_FAIL 
2016-06-22 22:23:19.224,Info ,1636,General.FabricInstallerServiceImpl,service stopping (shutdown = false) ... 
2016-06-22 22:23:19.224,Info ,1636,General.FabricInstallerServiceImpl,Stop FabricUpgradeManager called 
2016-06-22 22:23:19.240,Info ,2472,General.FabricInstallerServiceImpl,Close FabricUpgradeManager, with timeout 5:00.000 
2016-06-22 22:23:19.240,Noise ,2472,[email protected],Attempting to attach child AsyncOperation 3b4480c4d0. 
2016-06-22 22:23:19.240,Noise ,2472,[email protected],Calling OnStart 
2016-06-22 22:23:19.240,Noise ,2472,[email protected],Attempting to attach child AsyncOperation 3b4480c5d0. 
2016-06-22 22:23:19.240,Noise ,2472,[email protected],Calling OnStart 
2016-06-22 22:23:19.240,Noise ,2472,[email protected],FinishComplete called with S_OK 
2016-06-22 22:23:19.240,Noise ,2472,[email protected],FinishComplete called with S_OK 
2016-06-22 22:23:19.240,Noise ,2472,General.FabricInstallerServiceImpl,Close FabricUpgradeManager returned S_OK 
2016-06-22 22:23:19.240,Noise ,2472,[email protected],Detaching child AsyncOperation 3b4480c4d0. 
2016-06-22 22:23:19.240,Noise ,2472,[email protected],Detaching child AsyncOperation 3b4480c5d0. 

これは私が立ち往生しているポイントです。私の考えは次のとおりです。

  • セットアップファイルがコピーされセットアッププロセスが開始されたため、マシン間の通信とアクセスが問題なく動作しているようです。
  • サービスファブリックインストーラサービスはここで重要な役割を果たしているようです。
  • サービスファブリックインストーラサービスは、セットアッププロセスを開始したマシンで正常に動作しているようですが、リモートマシンでは失敗しているようです。

ありがとう。

+0

解決方法を見つけましたか?私たちは仕事で同様の問題を抱えています – Oliver

答えて

-2

私は同様の問題にぶつかりました。 Webインストーラを介してインストールされたService Fabric SDK/Service Fabricをインストールしていたことが分かりました。私はそれらをアンインストールし、それは働いた。

また、クラスタ内のノードではないマシンのスクリプトを実行する際に問題があります。 (私はコメントを落としたいが、十分なポイントがない)

+1

これを解決した方法の詳細を教えてください。 – Sage

関連する問題