Qu’est-ce que la reprise après sinistre ?
La reprise après sinistre (DR) englobe les procédures, politiques ou processus qui préparent l’infrastructure informatique vitale d’une organisation à se remettre efficacement des catastrophes naturelles ou d’origine humaine et à assurer la continuité des activités.
Des cyberattaques et des pannes d’équipement, en passant par les ouragans ou d’autres catastrophes naturelles, la RD doit couvrir tout scénario possible qui menace la disponibilité de l’infrastructure informatique. Ces dernières années, la reprise après sinistre a pris une place de plus en plus prépondérante dans les budgets informatiques des entreprises, représentant souvent 20 à 25% des dépenses informatiques.
Avoir le bon plan de reprise après sinistre
Un plan de reprise après sinistre (DRP) définit la manière dont une organisation réagira à un scénario de catastrophe donné, dans le but de prendre en charge les processus et fonctions métier urgents et de maintenir une continuité complète des activités.
Un DRP contient à la fois des éléments réactifs et préventifs et constitue un élément clé de la planification de la continuité des activités (PCA) de l’entreprise. Du côté réactif, un DRP délimite de nombreux scénarios de catastrophe et définit les réponses détaillées à chacun, dans le but de minimiser l’impact négatif de cet événement. Sur le plan préventif, un DRP vise à minimiser les effets négatifs de scénarios spécifiques en définissant ce que l’organisation doit faire pour les éviter.
Plus précisément, un DRP doit anticiper et définir un plan d’action en réponse à la perte de composants et de services informatiques essentiels à la mission tels que:
- Environnements complets de salle informatique
- Matériel informatique critique, y compris l’infrastructure réseau, les serveurs, les ordinateurs de bureau ou portables, les périphériques sans fil et les périphériques
- Connectivité des fournisseurs de services
- Applications logicielles d’entreprise
- Périphériques ou applications de stockage de données
Pour obtenir une efficacité maximale et maîtriser les coûts, les organisations doivent prévoir de tirer parti d’une combinaison de ressources internes et de solutions prises en charge par les fournisseurs dans leur planification de reprise après sinistre. La combinaison optimale interne/fournisseur dépend des objectifs spécifiques de reprise après sinistre de l’organisation, qui sont mesurés en termes d’Objectif de Temps de récupération (RTO) et d’Objectif de Point de récupération (RPO). L’objectif de temps de récupération peut être défini grossièrement comme la durée pendant laquelle une entreprise peut fonctionner sans disponibilité du système, tandis que l’objectif de point de récupération exprime l’âge des données une fois que les systèmes auront récupéré.
Reprise après sinistre des centres de données
Pour atteindre les objectifs RTO et RPO d’une organisation, les opérateurs de centres de données sont confrontés à de nombreux défis. La synchronisation des données est un défi majeur. En d’autres termes: Comment garantir au mieux que les données de tous les sites alternatifs soient fraîches, afin de garantir la cohérence des services et la continuité des activités, même en cas de catastrophe?
Dans une certaine mesure, la réponse à cette question réside dans le niveau de réplication, qui peut être défini comme la fréquence à laquelle le système récepteur (l’environnement de sauvegarde) accuse réception des données du système émetteur (l’environnement de production). Les méthodes de réplication les plus courantes sont:
- Réplication synchrone – La méthode de réplication la plus sûre, mais la plus exigeante en ressources. Dans un scénario de réplication synchrone, le système de réception reconnaît chaque modification reçue du système d’envoi. L’adoption de cette méthode nécessite la maintenance d’un site de sauvegarde « à chaud”, et elle est plus efficace en combinaison avec des solutions de basculement « à chaud” et des solutions GSLB (Global Server Load Balancing).
- Réplication semi-synchrone – Le système récepteur envoie un accusé de réception uniquement après la réception d’une série de modifications. Cette méthode de synchronisation est parallèle à l’approche de basculement « à chaud” et peut être le bon choix pour les services qui – en cas de catastrophe – peuvent permettre une certaine perte de données et un temps d’arrêt raisonnable.
- Réplication asynchrone – La réplication des données de cette méthode est plus rapide mais moins sécurisée, car le système d’envoi continue simplement d’envoyer des données, sans recevoir de réponse. Parallèlement à l’approche de basculement « à froid”, cette méthode est la mieux adaptée aux ressources statiques ou aux scénarios dans lesquels la perte de données est acceptable.
Lors de la création d’un DRP, les organisations doivent s’assurer que leur stratégie de basculement est entièrement en ligne avec la méthode de synchronisation de leur choix.
Par exemple, la stratégie de synchronisation/basculement » chaud-chaud” garantit que les données sont toujours synchronisées à 100% et qu’un système parallèle est toujours prêt à prendre le relais du système de production avec une latence ou un temps d’arrêt minimal.
Cependant, si un centre de données a choisi la réplication asynchrone, les frais de maintenance d’un serveur de basculement à chaud peuvent ne pas être justifiés, car les données ne seraient pas nécessairement entièrement répliquées à un moment donné de défaillance.
Enfin, il est important pour une reprise après sinistre efficace du centre de données de maintenir un dispositif de basculement hors site, qui surveillera l’état du système et redirigera le trafic en temps réel vers un centre de données de sauvegarde en cas de panne.