Savoir réagir à un incident majeur de production
En juin 2013, un incident a provoqué un arrêt du coeur SAP du système d'information financier de l'Etat, Chorus. Signalé dans la presse, l'incident devient une crise. Régine Diyani, directrice de l'AIFE (en photo), et Emmanuel Spinat, délégué à la maintenance et à la supervision opérationnelle, reviennent pour nous sur la résolution du problème. Avec sang-froid.
PublicitéCIO : Le mercredi 19 juin 2013, le coeur SAP de Chorus a subi un arrêt non-programmé. Quelle a été la chronologie exacte de l'incident ?
Emmanuel Spinat : A 10h20, il y a en effet eu un incident sur le site d'hébergement Bull de Trelazé près d'Angers. Au départ, nous avons constaté une difficulté d'accès à la production. L'incident a donc été signalé par l'exploitation, qui n'est pas sur place.
Nous avons lancé une procédure de diagnostic. Les équipements réseaux se sont alors mis en sécurité suite à une montée en température du local en lien avec un arrêt de la climatisation. Mais le système continuait de marcher. Les applicatifs impactés ont donc pu être fermés « proprement ». Chorus Formulaires n'a pas été touché. De la même façon, l'interfaçage avec les applicatifs de chaque ministère n'a pas été impacté alors que l'ensemble du SI est hébergé sur le même site.
CIO : Quelle est l'architecture technique ?
Emmanuel Spinat : Nous utilisons des serveurs Bull sous AIX avec des puces PowerPC 6 ou 7 pour héberger les applicatifs de bases de données. Ces serveurs sont plus résistants à la chaleur que les équipements réseaux et ne se sont pas mis en sécurité, contrairement à ces derniers. Par ailleurs, nous utilisons des baies de stockage EMC en RAID 6.
CIO : Que savez-vous à ce moment-là ?
Emmanuel Spinat : Bull nous a signalé qu'il y avait eu un dégazage [déclenchement du système anti-incendie à base de gaz inerte pour étouffer les incendies, NDLR]. Ce dégazage a entraîné l'arrêt de la climatisation, donc (...)
Lire la suite dans CIO.PDF 71
Article rédigé par
Bertrand Lemaire, Rédacteur en chef de CIO
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire