10 conceitos que você precisa saber sobre Quorum de Cluster

Direto ao ponto:

1. Quórum é a quantidade mínima de votos que o cluster precisa para continuar online, em outras palavras, a configuração de quórum determina o número de falhas que o cluster pode suportar permanecendo online.

2. Ausência de quórum em um cluster indica que o mesmo não está saudável, resultando na queda do Cluster.

3. O número de votos disponíveis para quórum é calculado através da soma dos votos dos nós do cluster disponíveis + voto testemunha (Witness).

4. A configuração de Disk witness é a mais indicada para Cluster Local, caso o cluster utilize storage compartilhada. O disco utilizado armazena uma cópia atualizada da database do cluster, sendo esta a database mais atualizada tomada como referência por todos os nós do cluster.

5. A configuração de file share witness é indicada para cluster geográficos, onde o voto de witness é associado a um file share que deve estar acessível ao nó que permanecerá online.

Exemplo

  • Cluster de 6 nós, divididos em 2 sites geograficamente distintos, cada site contém 3 nós do cluster.
  • O site 1 é o headquarter da empresa, em caso de falha de comunicação entre os sites, o serviço de cluster deve permanecer online apenas no site1, evitando assim a gravação de informações divergentes e não sincronizadas no recurso de cluster, devido a falha de rede entre os sites.
  • O file share witness deve ser configurado no site1, desta forma, os nós do site2 não terão acesso a este recurso em caso de falha, não contando assim com o voto de witness.

6. A configuração de file share witness não armazena uma cópia da database do cluster. Neste cenário o cluster trabalha com a função “Paxos Tag” para identificar qual nó possui a versão mais recente da database.

7. Existe uma configuração chamada Cloud Witness disponível no Widnows Server 2016, onde você pode utilizar o Azure como witness.

8. A configuração de Witness é definida de maneira automática durante a criação do cluster, com base nos recursos disponíveis. Esta configuração pode ser alterada a qualquer momento no console do cluster.

9. Para manter o Cluster online, o Quórum necessita de 50% dos votos dos nós + 1

Exemplo:

  • Cluster de 6 nós, divididos em 2 sites geograficamente distintos, cada site contém 3 nós do cluster.
  • Configuração de quórum: File share witness configurado no site 1.
    • Site 1 — 3 nós + file share witness = 4 votos
    • Site 2 — 3 nós = 3 votos
    • Total de votos: 7
  • Considere que a comunicação entre os sites falhou, os nós presentes no site A consideram os nós do site B offline, e vice-versa. Neste caso, apenas o site 1 irá permanecer online, pois ele possui 50% dos votos + 1. Os nós do site B não terão quórum suficiente para subir o cluster, evitando assim o cenário de “SPLIT-BRAIN”

10. A partir do Windows Server 2012 R2, o failvoer cluster conta com o recurso de Dynamic Quorum, onde o total de votos é calculado de maneira dinâmica,  com base nos recursos disponíveis. O objetivo é manter sempre um número ímpar de votos, otimizando a disponibilidade do cluster

Exemplo:

  • Cluster de 6 nós, divididos em 2 sites geográficamente distintos, cada site contém 3 nós do cluster.
  • Configuração de quórum: File share witness configurado no site 1.
    • Site 1 — 3 nós + file share witness = 4 votos
    • Site 2 — 3 nós = 3 votos
    • Total de votos: 7
  • Considere que o file share witness ficou indisponível. TOTAL DE VOTOS: 6
  • Como o total de votos disponíveis é um valor par, A partir do Windows Server 2012 R2, o dynamic qurum reorganiza a distribuição de votos, eliminando o voto de um dos nós automaticamente, mantendo assim um número de votos ímpar. Neste cenário, caso ocorra uma falha de comunicação, um dos sites terá 3 votos contra 2 votos do outro site, mantendo assim apenas site com quorum online.
  • É possível configurar o parâmetro LowerQuorumPriorityNodeID em um dos nós do site 2 com menor prioridade, garantindo assim que o voto neste nó seja removido caso haja a necessidade de recalcular o quórum de maneira dinâmica. Esta configuração irá garantir que o site 1 possua quórum, caso todos os nós estejam disponíveis.
  • Em Versões anteriores ao Windows Server 2012 R2, como Windows Server 2012 por exemplo caso exista apenas 50% dos votos de nós disponíveis, e o witness não esteja disponível, o serviço de cluster ficará completamente offline.

 

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *