Rendre vos systèmes résilients. 

En informatique, la résilience est la capacité d'un système à continuer de fonctionner en cas de panne ou de sollicitation extrême. La résilience consiste à mettre en place les moyens et les ressources adaptés, (sans les sur-dimensionner).

De quoi s'agit-il ? L’informatique doit pouvoir faire face à tous les aléas (pannes, pics d'utilisation, plan de reprise d'activité, etc.). Pour y parvenir, il est nécessaire de disposer de ressources disponibles en complément de celles utilisées "en temps normal". Les enjeux de disponibilité poussent ainsi à créer des architectures redondantes à tous les niveaux et à les tenir toujours disponibles en cas de panne pour minimiser les indisponibilités et les temps de reprise.

Quels enjeux ? Les coûts et impacts écologiques peuvent être au final disproportionnés par rapport aux enjeux. La juste performance, c'est la prise en compte de cet impact, afin d'optimiser les ressources dédiées à la résilience. De manière plus générale, l'enjeu est aussi, sans perdre de vue le caractère de plus en plus critique de beaucoup d'applications informatiques, de considérer l'éco-efficience comme un des paramètres à considérer dans les choix des solutions de résilience.

Cette règle incite à se poser des questions clés telles que, par exemple :
En cas de panne d'un serveur, peut-on se permettre d'attendre quelques secondes pour avoir à sa disposition le serveur de secours, ou doit-il être immédiatement disponible ?
Les systèmes de secours ou utilisés en cas de pics doivent-ils être les miroirs des systèmes principaux, ou peuvent-ils faire appels à des ressources externalisées, disponibles à la demande. Dans le dernier cas, les ressources destinées à la résilience peuvent être partagées plutôt que dédiées, d'où une consommation moindre.