What is disaster recovery?a recuperação de desastres (DR) abrange os procedimentos, políticas ou processos que preparam A infraestrutura de TI vital de uma organização para efetivamente se recuperar de desastres naturais ou induzidos pelo homem, e garantir a continuidade dos negócios.
a partir de ataques cibernéticos e falha de equipamentos, através de furacões ou outras catástrofes naturais-DR precisa cobrir qualquer cenário possível que ameace a disponibilidade de infra – estrutura de TI. Nos últimos anos, a recuperação de desastres assumiu um papel cada vez mais predominante nos orçamentos de computação corporativa, muitas vezes representando 20-25% das despesas de computação de TI.
Ter direito a plano de recuperação de desastres
Um plano de recuperação de desastres (DRP) delineia como uma organização irá responder a qualquer cenário de desastres, com o objetivo de apoiar sensíveis ao tempo, processos de negócios e funções, e mantendo a continuidade dos negócios.
um DRP contém elementos sensíveis e preventivos, e é uma parte fundamental do planejamento de Continuidade de negócios da empresa (BCP). Do lado responsivo, um DRP delineia vários cenários de desastre, e define as respostas detalhadas a cada um, com o objetivo de minimizar o impacto negativo desse evento. Do lado preventivo, um DRP visa minimizar os efeitos negativos de cenários específicos, definindo o que a organização precisa fazer para evitá-los.mais especificamente, um DRP precisa antecipar e delinear um plano de ação em resposta à perda de tais componentes e serviços de TI críticos para a missão como:para obter a máxima eficácia e manter os custos sob controle, as organizações devem planejar alavancar uma combinação de recursos internos e soluções apoiadas pelo fornecedor em seu planejamento de recuperação de desastres. A combinação ideal entre fornecedores e internos depende dos objetivos específicos de recuperação de desastres da organização, que são medidos em termos de objetivo do tempo de recuperação (OR) e objetivo do ponto de recuperação (or). O objetivo Tempo de recuperação pode ser definido como a quantidade de tempo que uma empresa pode funcionar sem a disponibilidade do sistema, enquanto o objetivo Ponto de recuperação expressa a idade dos dados será uma vez que os sistemas recuperar.
Data center disaster recovery
To meet an organization’s RTO and RPO objectives, data center operators face numerous challenges. Um desafio chave é a sincronização de dados. Por outras palavras: como melhor garantir que os dados em todos os locais alternativos são frescos, para garantir a consistência dos serviços e a continuidade dos negócios, mesmo em caso de desastre?
em certa medida, a resposta a esta questão reside no nível de replicação, que pode ser definido como a frequência com que o sistema receptor (o ambiente de backup) reconhece a recepção de dados do sistema de envio (o ambiente de produção). Os métodos de replicação mais comuns são::
- replicação síncrona-o método de replicação mais seguro, mas mais exigente em termos de recursos. Num cenário de replicação síncrono, o sistema receptor reconhece cada alteração recebida do sistema de envio. Adotar este método requer a manutenção de um site de backup” quente”, e é mais eficaz em combinação com soluções de failover” quente ” e soluções de balanceamento de carga do Servidor Global (GSLB).replicação Semi-síncrona – o sistema receptor envia Aviso de recepção apenas após uma série de alterações terem sido recebidas. Este método de sincronização é paralelo à abordagem de failover “quente”, e pode ser a escolha certa para serviços que – no caso de um desastre – pode permitir alguma perda de dados e uma quantidade razoável de tempo de inatividade.replicação assíncrona-a replicação de dados deste método é mais rápida, mas menos segura, pois o sistema de envio simplesmente continua a enviar dados, sem receber qualquer resposta. Paralelamente à abordagem de failover” frio”, este método é mais adequado para recursos estáticos ou cenários em que a perda de dados é aceitável.
ao criar um DRP, as organizações precisam garantir que sua política de failover está totalmente em linha com seu método de sincronização de escolha.
Por exemplo, a Política de sincronização/failover” quente ” garante que os dados são sempre 100% sincronizados, e que um sistema paralelo está sempre pronto para assumir para o sistema de produção com latência mínima ou tempo de inatividade.
no entanto, se um centro de dados tiver escolhido replicação assíncrona, a despesa de manter um servidor de falha quente pode não ser justificada, uma vez que os dados não seriam necessariamente replicados completamente em qualquer momento dado de falha.
Finalmente, é importante para a recuperação eficaz de desastres do centro de dados para manter um dispositivo de failover fora das instalações, que irá monitorar a saúde do sistema e redirecionar o tráfego em tempo real para um centro de dados de backup em caso de falha.