ce este recuperarea în caz de dezastru?
Disaster Recovery (DR) cuprinde procedurile, politicile sau procesele care pregătesc infrastructura IT vitală a unei organizații pentru a se recupera eficient în urma dezastrelor naturale sau induse de om și pentru a asigura continuitatea afacerii.
de la atacuri cibernetice și defecțiuni ale echipamentelor, prin uragane sau alte dezastre naturale-DR trebuie să acopere orice scenariu posibil care amenință disponibilitatea infrastructurii IT. În ultimii ani, recuperarea în caz de dezastru și-a asumat un rol din ce în ce mai predominant în bugetele de calcul ale întreprinderilor, reprezentând adesea 20-25% din cheltuielile de calcul IT.
având planul corect de recuperare în caz de dezastru
un plan de recuperare în caz de dezastru (DRP) delimitează modul în care o organizație va răspunde la orice scenariu de dezastru dat, cu scopul de a sprijini procesele și funcțiile de afaceri sensibile la timp și de a menține continuitatea completă a afacerii.
un DRP conține atât elemente responsive, cât și preventive și este o parte esențială a planificării continuității afacerii (BCP) a companiei. Pe partea receptivă, un DRP delimitează numeroase scenarii de dezastru și definește răspunsurile detaliate la fiecare, cu scopul de a minimiza impactul negativ al acelui eveniment. Pe partea preventivă, un DRP își propune să minimizeze efectele negative ale scenariilor specifice prin definirea a ceea ce trebuie să facă Organizația pentru a le evita.
mai precis, un DRP trebuie să anticipeze și să delimiteze un plan de acțiune ca răspuns la pierderea unor astfel de componente și servicii IT critice pentru misiune, cum ar fi:
- medii complete de săli de calculatoare
- hardware IT critic, inclusiv infrastructură de rețea, servere, computere desktop sau laptop, dispozitive wireless și periferice
- conectivitate furnizor de servicii
- aplicații software pentru întreprinderi
- dispozitive sau aplicații de stocare a datelor
pentru a obține o eficacitate maximă și pentru a menține costurile sub control, organizațiile ar trebui să planifice să utilizeze o combinație de resurse interne și soluții acceptate de furnizori în planificarea recuperării în caz de dezastru. Mixul optim intern / furnizor depinde de obiectivele specifice de recuperare în caz de dezastru ale organizației, care sunt măsurate în termeni de obiectiv timp de recuperare (RTO) și obiectiv punct de recuperare (RPO). Obiectivul timpului de recuperare poate fi definit aproximativ ca perioada de timp în care o afacere poate funcționa fără disponibilitatea sistemului, în timp ce obiectivul punctului de recuperare exprimă cât de vechi vor fi datele odată ce sistemele se recuperează.
data center disaster recovery
pentru a îndeplini obiectivele RTO și RPO ale unei organizații, operatorii centrelor de date se confruntă cu numeroase provocări. O provocare cheie este sincronizarea datelor. Cu alte cuvinte: cum să vă asigurați cel mai bine că datele din toate locațiile alternative sunt proaspete, pentru a garanta coerența serviciilor și continuitatea afacerii, chiar și în caz de dezastru?
într-o oarecare măsură, răspunsul la această întrebare constă în nivelul de replicare, care poate fi definit ca frecvența cu care sistemul receptor (mediul de rezervă) recunoaște primirea datelor din sistemul de trimitere (mediul de producție). Cele mai frecvente metode de replicare sunt:
- replicarea sincronă – cea mai sigură, dar cea mai solicitantă metodă de replicare a resurselor. Într-un scenariu de replicare sincronă, sistemul de recepție recunoaște fiecare modificare primită de la sistemul de trimitere. Adoptarea acestei metode necesită întreținerea unui site de rezervă ” fierbinte „și este cel mai eficient în combinație cu soluții de failover” fierbinți ” și soluții globale de echilibrare a încărcării serverului (GSLB).
- replicare Semi-sincronă – sistemul de recepție trimite confirmare numai după ce au fost primite o serie de modificări. Această metodă de sincronizare este paralelă cu abordarea failover „caldă” și poate fi alegerea potrivită pentru serviciile care – în caz de dezastru – pot permite o anumită pierdere de date și o perioadă rezonabilă de nefuncționare.
- replicare asincronă-replicarea datelor acestei metode este mai rapidă, dar mai puțin sigură, deoarece sistemul de trimitere continuă pur și simplu să trimită date, fără a primi niciun răspuns. În paralel cu abordarea failover” rece”, această metodă este cea mai potrivită pentru resurse statice sau scenarii în care pierderea de date este acceptabilă.
la crearea unui DRP, organizațiile trebuie să se asigure că politica lor de failover este pe deplin în conformitate cu metoda lor de sincronizare de alegere.
de exemplu, politica de sincronizare / failover „hot-hot” asigură că datele sunt întotdeauna sincronizate 100% și că un sistem paralel este întotdeauna gata să preia sistemul de producție cu latență minimă sau timp de nefuncționare.
cu toate acestea, dacă un centru de date a ales replicarea asincronă, este posibil ca cheltuielile menținerii unui server de failover fierbinte să nu fie justificate, deoarece datele nu ar fi neapărat reproduse complet în orice moment dat de eșec.
în cele din urmă, este important pentru recuperarea eficientă în caz de dezastru a Centrului de date să mențină un dispozitiv de failover off-premises, care va monitoriza sănătatea sistemului și va redirecționa traficul în timp real către un centru de date de rezervă în caz de eșec.