10 conceitos que você precisa saber sobre Quorum de Cluster

1. Quórum é a quantidade mínima de votos que o cluster precisa para continuar online

em outras palavras, a configuração de quórum determina o número de falhas que o cluster pode suportar permanecendo online.

 

2. Ausência de quórum em um cluster indica que o mesmo não está saudável

Se não existe quorum suficiente para sustentar o Cluster, Automaticamente não existem condições de manter o serviço online. Neste caso, o resultado esperado é a queda do serviço, até que o quorum seja restaurado.

Caso em caráter emergencial seja necessário subir um nó onde não existe quorum suficiente (50% dos votos dos nós + 1 voto) é possível utilizar o parametro FIXQUORUM (/FQ) na inicialização do serviço.

 

3. O número de votos disponíveis para quórum é calculado através da soma dos votos dos nós do cluster disponíveis + voto testemunha (Witness)

Em um cluster com 2 nós e um disco de witness, temos o total de 3 votos. No caso de falha de um dos nós, teremos 2 votos disponíveis, quorum suficiente para o cluster permanecer online.

 

4. A configuração de Disk witness é a mais indicada para Cluster Local, caso o cluster utilize storage compartilhada

O disco utilizado como Witness armazena uma cópia atualizada da database do cluster, sendo esta a database tomada como referência por todos os nós do cluster, durante sua inicialização. Esse processo garante mais eficiência no gerenciamento do cluster.

 

5. A configuração de file share witness é mais indicada para cluster geográficos

Neste modelo, o voto de witness é associado a um file share que deve estar acessível ao nó que permanecerá online, sendo geralmente configurado na estrutura do site principal onde o cluster deve permanecer online em caso de falha.

Exemplo

  • Cluster de 6 nós, divididos em 2 sites geograficamente distintos, cada site contém 3 nós do cluster.
  • O site 1 é o headquarter da empresa, em caso de falha de comunicação entre os sites, o serviço de cluster deve permanecer online apenas no site1, evitando assim a gravação de informações divergentes e não sincronizadas no recurso de cluster, devido a falha de rede entre os sites.
  • O file share witness deve ser configurado no site1, desta forma, os nós do site2 não terão acesso a este recurso em caso de falha, não contando assim com o voto de witness.

6. A configuração de file share witness não armazena uma cópia da database do cluster

Neste cenário o cluster trabalha com a função “Paxos Tag” para identificar qual nó possui a versão mais recente da database.

7. Existe uma configuração de Quorum chamada Cloud Witness

Disponível apenas no Windows Server 2016, permite utilizar o Azure como witness, associando a disponibilidade do cluster a conectividade com a internet.

8. A configuração de Witness é definida de maneira automática durante a criação do cluster

Esta configuração é feita com base nos recursos disponíveis no cluster, podendo ser alterada a qualquer momento no console do serviço.

9. Para manter o Cluster online, o Quórum necessita de 50% dos votos dos nós + 1

Exemplo:

  • Cluster de 6 nós, divididos em 2 sites geograficamente distintos, cada site contém 3 nós do cluster.
  • Configuração de quórum: File share witness configurado no site 1.
    • Site 1 — 3 nós + file share witness = 4 votos
    • Site 2 — 3 nós = 3 votos
    • Total de votos: 7
  • Considere que a comunicação entre os sites falhou, os nós presentes no site A consideram os nós do site B offline, e vice-versa. Neste caso, apenas o site 1 irá permanecer online, pois ele possui 50% dos votos + 1. Os nós do site B não terão quórum suficiente para subir o cluster, evitando assim o cenário de “SPLIT-BRAIN”

10. A partir do Windows Server 2012 R2, o failvoer cluster conta com o recurso de Dynamic Quorum

No conceito de Dynamic Quorum o total de votos é calculado de maneira dinâmica,  com base nos recursos disponíveis. O objetivo é manter sempre um número ímpar de votos, otimizando a disponibilidade do cluster

Exemplo:

  • Cluster de 6 nós, divididos em 2 sites geográficamente distintos, cada site contém 3 nós do cluster.
  • Configuração de quórum: File share witness configurado no site 1.
    • Site 1 — 3 nós + file share witness = 4 votos
    • Site 2 — 3 nós = 3 votos
    • Total de votos: 7
  • Considere que o file share witness ficou indisponível. TOTAL DE VOTOS: 6
  • Como o total de votos disponíveis é um valor par, A partir do Windows Server 2012 R2, o dynamic qurum reorganiza a distribuição de votos, eliminando o voto de um dos nós automaticamente, mantendo assim um número de votos ímpar. Neste cenário, caso ocorra uma falha de comunicação, um dos sites terá 3 votos contra 2 votos do outro site, mantendo assim apenas site com quorum online.
  • É possível configurar o parâmetro LowerQuorumPriorityNodeID em um dos nós do site 2 com menor prioridade, garantindo assim que o voto neste nó seja removido caso haja a necessidade de recalcular o quórum de maneira dinâmica. Esta configuração irá garantir que o site 1 possua quórum, caso todos os nós estejam disponíveis.
  • Em Versões anteriores ao Windows Server 2012 R2, como Windows Server 2012 por exemplo caso exista apenas 50% dos votos de nós disponíveis, e o witness não esteja disponível, o serviço de cluster ficará completamente offline.

 

Marcado com , ,

Deixe uma resposta

%d blogueiros gostam disto: