Problemas para conectar ao cluster via failover cluster Manager?

Não é incomum enfrentarmos falhas para conectar ao Cluster via Failover cluster manager. Geralmente um simples restart do node resolve o problema, mas e se a necessidade de administração for algo emergente, e o restart não for possível no momento

Aqui a lista de alguns possíveis erros:

 

  • “RPC Server Unavailable” error.
  • Access is Denied.
  • The computer ‘Node1’ could not be reached.
  • Failed to retrieve the maximum number of nodes for ‘{0}’.
  • The computer ‘Node1.contoso.com’ does not have the Failover Clustering feature installed. Use Server Manager to install the feature on this computer.

 

Este tipo de problema pode estar relacionado desde a falhas de resolução de nomes, bloqueio de firewall, até mesmo pontos mais complexos, como falha no WMI. A seguir vou compartilhar algumas dicas:

  1. Comece pelo simples!

    A- Testar a comunicação com o nome do cluster via ping é uma boa opção para confirmar se o DNS esta ok.
    B- Todos os serviços necessários para o cluster estão iniciados? Serviço de Cluster, Windows Management Instrumentation, Remote Procedure Call…

DICA: Um procedimento que sempre me ajuda a corrigir problemas é ordenar os serviços em execução no servidor, de forma a identificar serviços do tipo “AUTOMÁTICO” que não estejam iniciados. Foi exatamente assim que corrigi uma situação onde o failover Clustter manager apresentava o erro acima, devido ao serviço TCP/IP NetBios helper estar parado.

Se um serviço está configurado para inicar automaticamente, e está parado, muito provavelmente alguma função dependente deste serviço irá falar. Tomar esta linha de trabalho é algo importnate para corrigir problemas rapidamente.

C- Já olhou o event viewer? Eventos de aplicação e sistema podem realmente nos auxiliar a identificar causas de problemas e partir para a correção especifica, sem precisar perder tempo com ações desnecessárias.

2- Have you tried to turn off and on again?

Um restart pode facilmente corrigir problemas com quotas WMI excedidas, falta de recursos, falha de serviços, falha na execução de componentes, etc. Caso o restart seja uma opção, este procedimento pode te poupar algumas horas de trabalho. Considerando um ambiente Altamente disponível, é importante garantir a movimentação de recursos a fim de evitar impactos operacionais.

3- Agora ficou sério

Se as validações primárias não identificarem a causa do problema, ai é hora de investir um pouco mais de tempo em procedimentos de maior complexidade.

No caso do failover cluster manager, quem está a frente de toda a comunicação estabelecida é o WMI, sendo assim, falhas nos repositorios ou MOFs podem resultar em falhas de conectividade.

Para validar a estrutura WMI:

A- Problemas gerais com os repositórios podem ser identificados através da execução do seguinte comando:

WINMGMT /VERIFYREPOSITORY

    1. Utilizar o WBEMTEST para testar a conectividade na instancia WMI do cluster é um teste efetivo:
    2. Abra um prompt elevado, e digite o comando WBEMTEST.
    3. Clique em connect, e na tela de conexão digite root\MSCluster


B- Se você visualizar as opções adicionais disponíveis, a conexão ocorreu com sucesso. Qualquer erro neste procedimento indica problemas com WMI.

C- Caso seja este o cenário, é possível reconfigurar o repositório WMI através do procedimento abaixo:

    1. Pare o serviço Windows Management Instrumentation(NET STOP WMI)
    2. Inicie novamente o serviço (NET START WMI)
    3. Execute o seguinte comando: winmgmt /ResetRepository

 

D- Se o problema persistir, podemos recompilar o MOF do cluster:

cd c:\windows\system32\wbem

mofcomp.exe cluswmi.mof

 

Estes procedimentos podem te ajudar a corrigir problemas com ao conectar no cluster. Se o seu problema não for resolvido, ou até mesmo se o problema afetar mais de um node, os links abaixo contém steps adicionais a serem seguidos:

 

https://blogs.technet.microsoft.com/askcore/2013/12/17/unable-to-launch-cluster-failover-manager-on-any-node-of-a-20122012r2-cluster/

https://blogs.msdn.microsoft.com/clustering/2010/11/23/trouble-connecting-to-cluster-nodes-check-wmi/

Marcado com , , , , ,

Deixe uma resposta

%d blogueiros gostam disto: