Alta disponibilidade e failover

Sua empresa está preparada para a alta disponibilidade e failover?

O tempo de inatividade. A expressão de grande pavor no núcleo de um profissional de Tecnologia da Informação (TI). O tempo de inatividade cria uma porta de entrada para um labirinto de mais horas de manutenção e gestores impacientes.

As empresas em crescimento exigem uma infraestrutura confiável que reduza o tempo de inatividade e pontos de falha, tornando os termos “alta disponibilidade” e “failover” mais populares do que nunca. 

Mas, além de tecnologias buzzwords, quais são as implicações tangíveis para gerentes ou proprietários de negócios? 

Continue a leitura e saiba tudo sobre failover!

Alta disponibilidade e failover

Ambientes de disponibilidade

Na indústria de TI, o termo disponibilidade geralmente refere-se ao período de tempo no qual se espera que um serviço esteja disponível. Mas você sabe o que faz a infraestrutura de um ambiente ser “altamente disponível”? 

O Grupo de Pesquisa Harvard divide os ambientes disponíveis em cinco classificações: da AE0 a AE4.

O AE0 é um sistema convencional, com algumas interrupções ou potencial para a perda de dados. 

Um ambiente AE4 proporciona uma operação 24/7, sem perda de dados, e quaisquer falhas são transparentes para o usuário. 

Embora não haja nenhuma classificação específica da indústria para alta disponibilidade, as classificações de Harvard ajudam a criar um quadro geral para a característica disponibilidade. A alta disponibilidade cai sensivelmente em torno das classificações AE2 e AE3.

A disponibilidade é medida em porcentagem. A disponibilidade de 99% significa que há uma chance de 1% de ocorrer um tempo de inatividade. Em um ano de 365 dias, isso significa 3,65 dias de inatividade. 

A maioria dos sistemas oferecem em torno de 99,99% ou 99,999% de disponibilidade. Tecnicamente não há disponibilidade de 100%, mas muitos sistemas de alta disponibilidade têm tempo de inatividade mínimo em comparação com sistemas arcaicos ou não confiáveis.


Os componentes de alta disponibilidade

A alta disponibilidade é possível graças à tolerância a falhas e redundância. A tolerância a falhas é definida como um recurso que, em caso de falha de um componente, desencadeia outro procedimento de backup ou componente para assumir. Isso significa pouco ou nenhum serviço de perda. 

A tolerância a falhas é normalmente estabelecida com alguma combinação de software e hardware. Essencialmente, ela garante que o serviço está disponível para os usuários em todos os momentos.

Ao implantar um sistema de alta disponibilidade, parte da criação de uma alta tolerância a falhas é identificar e expulsar pontos únicos de falha (SPOF). O SPOF é um componente do sistema que, quando falha, perturba todo o sistema, tornando-o pouco confiável ou não disponível. 

A redundância serve essencialmente como um backup, além de contribuir para a disponibilidade geral do sistema. Ela pode ser passiva ou ativa.

Redundância ativa

Envolve dois sistemas de processamento exatamente iguais, mas apenas uma saída é usada para que não haja redundância no ponto final. Ambos os componentes são igualmente potentes, assim, se um dispositivo falhar, não há alteração nas capacidades de um dispositivo para outro.

Redundância passiva 

Permite que um dispositivo processe a ação e o outro permaneça inativo. O segundo dispositivo fica pronto para ser utilizado em caso de falha. Isso requer um componente de comutação, que pode mudar o canal de entrada e de saída durante o processamento de uma falha.

A redundância atenua os SPOFs, fornecendo uma segurança a mais se um único componente de hardware falhar. Sem redundância, uma única falha de hardware pode ser fatal para uma máquina.


Implementação de alta disponibilidade

O que significa alta disponibilidade em ação? Para os fins deste artigo, vou me concentrar em alta disponibilidade com relação a servidores físicos, ao contrário de um ambiente virtual. No local de alta disponibilidade (disponibilidade de servidor), é usado principalmente para a continuidade dos negócios. Grandes quantidades de tráfego contribuem para redes de atraso e podem resultar em tempo de inatividade.

Para atenuar isso, as empresas empregam um princípio de redundância e implantam dois servidores, tipicamente, em um local singular. No SmartFile, a nossa solução FileHub é capaz de funcionar da mesma maneira. Os dois servidores rodam em redundância ativo-ativo, porque ambos os dispositivos estão trabalhando em coordenação, a carga de tráfego e processamento é levantada a partir de um único dispositivo. Isso melhora a velocidade e eficácia da rede, traduzindo para o mínimo ou nenhum tempo de inatividade.

A alta disponibilidade deve ser utilizada quando ocorrer um processo de negócio crítico. Por exemplo, uma empresa de construção que utiliza um servidor de arquivos para a habitação de todos os seus arquivos de projeto. Internamente, essa é a essência de sua organização. Externamente, subcontratados e funcionários remotos precisam de acesso a arquivos em uma base sensível ao tempo. O tempo de inatividade é igual a atrasos e impacto direto nas receitas.

Uma empresa de software que utiliza SmartFile para coletar arquivos de log ou empurrar atualizações de software aos seus clientes depende de acessibilidade. Um cliente que não pode fazer upload de arquivos de log ou um técnico de suporte que não podem baixar os arquivos está atrasando a resolução de um problema. A desaceleração na resolução de problemas pode prejudicar as relações comerciais. A perda de confiança pode resultar na perda de um cliente.

Nem todo mundo precisa de alta disponibilidade, mas para algumas empresas, é uma necessidade. Em última análise, a alta disponibilidade é geralmente implantado para complementar uma estratégia de TI da organização.


O que é failover?

O failover, um chavão cada vez mais popular, fornece um plano de contingência para os serviços prestados. Failover, como alta disponibilidade, requer a utilização de dois dispositivos, mas, ao contrário de elevada disponibilidade, o failover tipicamente coloca servidores em locais diferentes. Quando um falha, o outro assume. Isso está relacionado com redundância, com a diferença de que a redundância é o componente físico, enquanto failover é o mecanismo para acionar o plano de contingência.


Como funciona o failover?

Os bancos de dados também podem utilizar o recurso do failover. Nesse caso, é possível ter um servidor primário, que hospeda os bancos de dados e fica em funcionamento. Há também um servidor secundário, que também hospeda o banco de dados e deve estar em uma região diferente do primário.

Assim, quando o primeiro tem algum problema, o segundo servidor é ativado, e o banco de dados secundário passa a ser a base de acesso às informações, gerando assim uma alta disponibilidade.


Failover em banco de dados

Há duas maneiras de um plano de contingência podem ser acionados e para a troca de dispositivo ocorrer. Ambos entregar o mesmo resultado desejado, e, como resultado, o termo failover é utilizado para cobrir ambos os sentidos.

Tecnicamente, quando o interruptor é automático é referida como falha. Se o interruptor requer intervenção humana (comutação manual de dispositivos, ou aprovação antes de um plano de contingência), ela é conhecida como a alternância.


Side Nota: failover vs. comutação

Há duas maneiras de um plano de contingência poder ser acionado e da troca de dispositivo ocorrer. Ambos entregam o mesmo resultado desejado, e, como resultado, o termo failover é utilizado para cobrir ambos os sentidos.

Tecnicamente, quando o interruptor é automático, é referida como falha. Se o interruptor requer intervenção humana (comutação manual de dispositivos ou aprovação antes de um plano de contingência), ela é conhecida como alternância.


O que desencadeia failover?

O failover pode ser desencadeado de várias maneiras. Se o dispositivo de backup detecta um link para baixo do primário, ocorre um failover. Failover também pode ser desencadeado por uma anomalia no coração do dispositivo. A pulsação é o mecanismo de detecção que se comunica entre os dispositivos primários e de backup. Se o dispositivo primário deixa de reagir à pulsação do coração, o dispositivo de backup assume.


Quais as vantagens de usar o failover?

Veja as principais vantagens de utilizar o failover na sua empresa:

Versatilidade

O failover pode ser aplicado nos mais diversos hardwares, desde roteadores até servidores físicos. Nos softwares, ele também é aplicado, nesse caso, para trazer redundância aos programas, como banco de dados e servidores virtuais.

Alta disponibilidade

Para não terem prejuízos, diversas empresas utilizam o failover para que as suas atividades não sejam cessadas. Essa alta disponibilidade permite que a produtividade não seja reduzida e que os clientes fiquem mais satisfeitos.

Manutenções facilitadas

Fazer a manutenção em um sistema pode atrasar diversos processos e até mesmo parar parte das atividades de uma empresa. Porém, com o failover, isso não é necessário, já que, enquanto as manutenções são realizadas em um sistema, o outro fica operando normalmente.


Implementando failover

Geralmente, failover serve principalmente como uma estratégia de recuperação de desastres. Dois dispositivos são implantados em locais estratégicos, geograficamente diversificados, normalmente muito longe do escritório original. Dessa forma, se um desastre natural ou emergência torna o dispositivo no local inutilizável, o segundo dispositivo está fora do caminho do mal.

No SmartFile, implantamos geograficamente diversos servidores capazes que aproveitam uma redundância ativo-passivo. Quando é detectada uma anomalia no padrão de trabalho do primário, o fluxo de trabalho pode ser dirigido para o segundo dispositivo. Para as empresas que precisam se adaptar a estações em que ocorrem furacões ou tornados, failover é uma bênção. Tempo de inatividade e perda de receita não são opções, e failover mantém o negócio funcionando sem problemas.


Muitas opções, tão pouco tempo

Decidir se a sua empresa precisa de alta disponibilidade, failover ou ambos é difícil. Em última análise, a decisão deve complementar a sua estratégia de TI organizacional com foco específico no processo de negócio que está sendo abordado.

As empresas maiores são inerentemente focadas na continuidade do negócio por causa do impacto mais amplo. Se a recuperação de desastres é objetivo, o failover é a sua melhor opção. Alta disponibilidade e failover são mais do que apenas palavras de ordem tecnológica. Eles fornecem uma rede mais estável e fortificada.


HTI Tecnologia the database company
HTI Tecnologia Selo ISO9001
Contato
  • (11) 4063-6900
  • Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo.
  • Segunda à Sexta: 09:00 às 18:00
  • R. Claudio Soares, 72 - São Paulo, SP
2021 HTI Tecnologia. Todos os direitos reservados. Política de Privacidade