Che cos’è il disaster recovery?
Disaster Recovery (DR) comprende le procedure, le politiche o i processi che preparano l’infrastruttura IT vitale di un’organizzazione per recuperare efficacemente da disastri naturali o causati dall’uomo e garantire la continuità aziendale.
Da attacchi informatici e guasti alle apparecchiature, attraverso uragani o altri disastri naturali-DR deve coprire qualsiasi possibile scenario che minaccia la disponibilità dell’infrastruttura IT. Negli ultimi anni, il disaster recovery ha assunto un ruolo sempre più predominante nei budget di calcolo aziendali, spesso rappresentando il 20-25% delle spese di calcolo IT.
Avere il giusto piano di disaster recovery
Un piano di disaster recovery (DRP) delinea come un’organizzazione risponderà a qualsiasi scenario di disastro, con l’obiettivo di supportare processi e funzioni aziendali time-sensitive e mantenere la piena continuità aziendale.
Un DRP contiene sia elementi reattivi che preventivi ed è una parte fondamentale del Business Continuity Planning (BCP) dell’azienda. Sul lato reattivo, un DRP delinea numerosi scenari di disastro e definisce le risposte dettagliate a ciascuno, con l’obiettivo di minimizzare l’impatto negativo di quell’evento. Sul lato preventivo, un DRP mira a minimizzare gli effetti negativi di scenari specifici definendo ciò che l’organizzazione deve fare per evitarli.
Più specificamente, un DRP deve anticipare e delineare un piano d’azione in risposta alla perdita di componenti e servizi IT mission-critical come:
- computer Completo ambienti
- Critica hardware tra cui l’infrastruttura di rete, server, computer desktop o portatile, senza fili di dispositivi e periferiche
- fornitore del Servizio di connettività
- Enterprise di applicazioni software
- dispositivi di archiviazione di Dati o applicazioni
Per ottenere la massima efficacia e mantenere i costi sotto controllo, le organizzazioni devono pianificare a sfruttare una combinazione di risorse interne e supportati dai fornitori di soluzioni di Disaster Recovery planning. Il mix ottimale interno / fornitore dipende dagli obiettivi specifici di disaster recovery dell’organizzazione, misurati in termini di Recovery Time Objective (RTO) e Recovery Point Objective (RPO). L’obiettivo del tempo di ripristino può essere definito approssimativamente come la quantità di tempo in cui un’azienda può funzionare senza la disponibilità del sistema, mentre l’obiettivo del punto di ripristino esprime la età dei dati una volta ripristinati i sistemi.
Data center disaster recovery
Per soddisfare gli obiettivi RTO e RPO di un’organizzazione, gli operatori dei data center devono affrontare numerose sfide. Una sfida chiave è la sincronizzazione dei dati. In altre parole: come garantire al meglio che i dati in tutte le sedi alternative siano freschi, per garantire la coerenza del servizio e la continuità aziendale, anche in caso di disastro?
In una certa misura, la risposta a questa domanda risiede nel livello di replica, che può essere definito come la frequenza con cui il sistema ricevente (l’ambiente di backup) riconosce la ricezione dei dati dal sistema di invio (l’ambiente di produzione). I metodi di replica più comuni sono:
- Replica sincrona: il metodo di replica più sicuro ma più impegnativo per le risorse. In uno scenario di replica sincrona, il sistema ricevente riconosce ogni singola modifica ricevuta dal sistema di invio. L’adozione di questo metodo richiede la manutenzione di un sito di backup ” hot “ed è più efficace in combinazione con soluzioni di failover” hot” e soluzioni Global Server Load Balancing (GSLB).
- Replica semi-sincrona: il sistema ricevente invia il riconoscimento solo dopo aver ricevuto una serie di modifiche. Questo metodo di sincronizzazione è parallelo all’approccio di failover” caldo ” e può essere la scelta giusta per i servizi che – in caso di disastro – possono consentire una certa perdita di dati e una quantità ragionevole di tempi di inattività.
- Replica asincrona: la replica dei dati di questo metodo è più veloce ma meno sicura, poiché il sistema di invio continua semplicemente a inviare dati, senza ricevere alcuna risposta. Parallelamente all’approccio di failover” freddo”, questo metodo è più adatto per risorse statiche o scenari in cui la perdita di dati è accettabile.
Quando si crea un DRP, le organizzazioni devono assicurarsi che i criteri di failover siano completamente in linea con il metodo di sincronizzazione scelto.
Ad esempio, il criterio di sincronizzazione/failover “hot-hot” garantisce che i dati siano sempre sincronizzati al 100% e che un sistema parallelo sia sempre pronto a subentrare per il sistema di produzione con latenza o tempi di inattività minimi.
Tuttavia, se un data center ha scelto la replica asincrona, le spese di mantenimento di un server di failover caldo potrebbero non essere garantite, poiché i dati non sarebbero necessariamente replicati completamente in un dato momento di errore.
Infine, è importante per un efficace ripristino di emergenza del data center mantenere un dispositivo di failover off-premise, che monitora l’integrità del sistema e reindirizza il traffico in tempo reale a un data center di backup in caso di errore.