Trois leçons que les DSI peuvent tirer de la panne du FAI Rogers au Canada

Les DSI pourraient tirer trois grandes leçons de l'arrêt brutal du service Internet par le fournisseur Rogers Communications, qui a déconnecté des millions de Canadiens, interrompu le service 911, mis hors circuit les terminaux de paiements aux points de vente, et plus encore pendant plus d'une journée.
PublicitéLe 8 juillet 2022, une mise à jour de maintenance bâclée sur le réseau du fournisseur d'accès Internet Rogers au Canada a interrompu, pendant 12 heures au moins, l'accès à Internet dans tout le pays, et continué d'affecter certains clients durant plusieurs jours. L'impact a été profond. La panne nationale a affecté le service téléphonique et Internet d'environ 12,2 millions de clients, soit environ 25 % de la capacité Internet du Canada, interrompant les paiements du réseau Interac aux point de vente, empêchant les utilisateurs de téléphones mobiles Rogers d'accéder aux services d'urgences 911, perturbant les services de transport en commun qui dépendent du paiement en ligne, et créant même le chaos au niveau des feux de circulation à Toronto qui dépendent des communications mobiles pour leur synchronisation. Pour couronner le tout, la panne a même obligé le musicien canadien The Weeknd à reporter la première étape de sa tournée mondiale au Rogers Centre de Toronto.
En cause ? Comme l'ont révélé par la suite les éléments fournis par Rogers au Conseil de la radiodiffusion et des télécommunications canadiennes, la mise à jour « a supprimé un filtre de routage et permis à toutes les routes possibles vers Internet de passer par les routeurs ». Si bien que « certains équipements de routage du réseau ont été débordés, dépassant leurs capacités et les empêchant de router le trafic, ce qui a entraîné l'arrêt du traitement du trafic par le réseau central commun ».
Même si Rogers - l'une des principales entreprises canadiennes d'Internet, de radiodiffusion et de téléphonie mobile sans fil - a rétabli le service pour la plupart des clients en l'espace d'une journée, la perte catastrophique de service a perturbé les entreprises canadiennes. Certaines d'entre elles, comme le détaillant de fournitures agricoles Peavey Mart qui exploite une centaine de points de vente, disposaient déjà d'un accès redondant à d'autres fournisseurs d'accès à Internet, ont été moins affectées. Par conséquent, « seuls deux magasins ont été directement touchés et n'avaient pas de connexion Internet », a expliqué Shaun Guthrie, premier vice-président des technologies de l'information de l'entreprise et vice-président de la CIO Association of Canada. « Mais, nous dépendons quand même des services Interac pour les transactions de nos clients, qui dépendent elles-mêmes uniquement de Rogers, et nous étions donc dans l'impossibilité d'effectuer des paiements par carte de débit », a-t-il ajouté.
1. Pas seulement un problème interne
« Pendant un jour ou deux, certains des organismes sans but lucratif dont je m'occupe n'ont plus été en mesure de savoir si les besoins des personnes vulnérables étaient satisfaits », a expliqué pour sa part Helen Knight, DSI virtuelle et consultante en technologie stratégique pour les organismes sans but lucratif canadiens. « Pour ma part, je n'avais plus aucun moyen de communiquer avec mes enfants. Ma fille de 13 ans est restée dehors jusqu'à 22 heures et je craignais qu'elle ne trouve aucun moyen de rentrer à la maison ». D'autres n'ont pas eu autant de chance. « Notre entreprise mondiale qui produit des toboggans et des attractions pour parcs aquatiques, a été très affectée par la panne du réseau Rogers, bien plus que nous ne le pensions au départ », a expliqué Chris Palsenbarg, directeur des opérations IT et du service d'assistance de WhiteWater West Industries. « Les employés en déplacement à l'étranger n'ont même pas pu utiliser leur téléphone », a-t-il indiqué. Et si l'entreprise canadienne de cybersécurité/cyberintelligence Sapper Labs Group n'a pas été touchée par la panne de Rogers, « bon nombre de ses partenaires, clients et concurrents l'ont été », comme l'a expliqué Dave McMahon, chef du renseignement chez Sapper Labs. « La panne a eu un effet de ricochet sur le marché, et certaines entreprises ne s'en sont pas encore totalement remises », a-t-il ajouté.
PublicitéSuite à la panne de Rogers, les DSI, cadres et experts IT canadiens se sont interrogés sur leur niveau de préparation pour faire face à de futures pannes de ce genre. Leurs conclusions valent la peine d'être prises en compte par les DSI du monde entier, qui risquent tous d'être confrontés à des pannes de service similaires dans leur propre pays, qu'elles soient dues à des problèmes de système, à des intrusions ou à des pannes de courant liées à des évènements environnementaux ou autres.
2. L'intérêt de la redondance
La panne de Rogers a montré l'utilité d'un accès redondant à un fournisseur d'accès Internet, malgré le coût supplémentaire que cela peut représenter. Contrairement à certaines entreprises qui rechignent à cette dépense, Peavey Mart a opté pour un accès Internet redondant quand c'est possible. La panne du 8 juillet 2022 lui a donné raison. De plus, la défaillance du réseau de Rogers n'a pas pris l'entreprise au dépourvu, car « nous surveillons de manière proactive l'état de nos communications de données », a expliqué Shaun Guthrie, premier vice-président des technologies de l'information de Peavey Mart et vice-président de la CIO Association of Canada. « Aussi, dès que les magasins ont été touchés par la panne, ils ont automatiquement basculé vers leurs FAI secondaires grâce à notre infrastructure SD-WAN », a-t-il ajouté.
Les organisations à but non lucratif, comme l'Armée du Salut du Canada, ne peuvent pas se permettre d'avoir la même infrastructure que des entreprises comme Peavey Mart. Mais leurs DSI sont des experts déterminés, habitués à « accomplir des exploits incroyables à l'aide de logiciels gratuits et de matériel donné », a expliqué Helen Knight, DSI virtuelle et consultante en technologie stratégique pour les organismes sans but lucratif canadiens. « Ils sont habitués à ce que leur infrastructure informatique vieillissante tombe en panne, et ils se débrouillent généralement tout seul avec des processus manuels », a-t-elle ajouté. De fait, les DSI de ces ONG arrivent à résoudre les pannes de FAI, du moins quand elles se produisent. « L'impact de la perte de données relative à la panne ne sera perçu que plus tard, quand elles ne trouveront pas les données attestant de leurs actions auprès de leurs donateurs, ce qui pourrait avoir un impact sur les subventions futures », a expliqué Mme Knight.
Cela étant, cette dernière pense que la panne de Rogers pourrait faire changer les mentalités de ces organisations au sujet de l'accès redondant aux FAI. « Après tout, cela fait des années que les entreprises ont fait le choix d'une connexion redondante pour tous leurs éléments critiques. Le bon côté des choses, c'est que ces ONG prennent désormais conscience d'un facteur de risque qu'elles n'avaient peut-être pas pris en compte », a-t-elle ajouté. « Si cet incident leur permet de reconnaître qu'elles ont besoin d'un responsable technologique de haut niveau et de la nécessité d'aligner leurs plans stratégiques sur une feuille de route technique, alors son impact aura été positif. C'est bien mieux, plus facile et moins coûteux que d'être confronté à un cyberpiratage ! »
3. Vérifier les plans de secours des fournisseurs
Dans le cas de Sapper Labs, « la panne de Rogers a renforcé notre confiance dans notre propre architecture et notre mode de fonctionnement », a déclaré Dave McMahon, le chef du renseignement de l'entreprise canadienne de cybersécurité/cyberintelligence. Mais ce sentiment de confiance a renforcé le fait que l'infrastructure IT d'une entreprise n'existe pas de manière isolée. Il s'agit plutôt d'un maillon d'une chaîne de fournisseurs d'accès à Internet, de plateformes cloud et d'autres qui se connectent à l'entreprise via Internet. Ainsi, « l'une des leçons à tirer de la panne de Rogers c'est qu'il faut s'assurer que la chaîne d'approvisionnement, les partenaires et les clients sont tous préparés et que des mesures d'urgence ont bien été prévues pour maintenir les opérations commerciales », a ajouté M. McMahon. « Un autre aspect très instructif de la panne, c'est qu'elle a immédiatement révélé qui était client de Rogers, s'il disposait d'autres moyens de communication, son niveau de maturité en matière de cybersécurité et les interdépendances critiques dans tout l'écosystème ». Peavey Mart est tout aussi diligent pour vérifier les vulnérabilités dans sa chaîne d'approvisionnement des données. « Nous demandons d'emblée à tous nos fournisseurs de cloud s'ils ont une redondance, si leurs systèmes intègrent des systèmes de sauvegarde, et s'ils ont mis en place des plans de continuité des activités pour qu'en cas de panne, leurs employés sachent quoi faire », a déclaré Shaun Guthrie. Malheureusement, les détaillants comme Peavey Mart n'ont pas le poids nécessaire pour exiger ce genre de réponses de gros acteurs interbancaires canadiens comme Interac. « Par conséquent, nous pouvons juste supposer qu'Interac a mis en place ces mesures de sauvegarde, ce qui n'était manifestement pas le cas », a-t-il ajouté.
D'autres pannes de FAI prévisibles
La résolution de la panne de Rogers au Canada a été suivie d'enquêtes gouvernementales, de reportages à charge dans les médias et de beaucoup d'indignation publique. Mais rien de tout cela ne pourra changer le fait que les réseaux des FAI sont des systèmes vastes et complexes, pour lesquels il est difficile de simuler et de modéliser la réponse aux mises à jour de maintenance. Par conséquent, malgré toutes les améliorations que le fournisseur Rogers Communications a promis d'apporter et que d'autres FAI canadiens pourraient reproduire au nom de la prudence M. Guthrie est persuadé qu'il y aura d'autres défaillances. « Je ne sais pas quel fournisseur sera affecté, mais je pense qu'un autre évènement de ce genre se produira d'ici à un an », a-t-il déclaré.
Cela étant, les DSI dont les entreprises dépendent de l'accès aux FAI doivent prendre des mesures dès maintenant pour protéger leurs entreprises contre ces pannes. Selon Dave McMahon, la voie à suivre est claire : « Les doubles fournisseurs et les systèmes indépendants redondants sont les meilleures pratiques de l'industrie », a-t-il affirmé. « C'est la définition même d'un système à haute disponibilité. C'est pourquoi tous les employés de Sapper Labs disposent déjà de multiples moyens de communication sécurisés et de capacités de collaboration en ligne. Nous évaluons actuellement la meilleure façon d'étendre des solutions sécurisées similaires à haute disponibilité à nos clients et partenaires », a ajouté le premier vice-président des technologies de l'information de Peavey Mart.
Dans le même temps, les DSI doivent rester humbles et ne pas surestimer leur capacité à planifier de tels événements à l'avance. « Comme on peut le voir, la technologie est omniprésente et de plus en plus complexe, et beaucoup de gens et d'entreprises ont été confrontées à des défis techniques nouveaux et complexes au cours des deux dernières années. De sorte que, même s'il est possible de protéger les entreprises contre les pannes de type Rogers, il n'est pas possible ou rentable de se protéger contre tous les risques », a déclaré Mme Knight. « Il s'agit plutôt de quantifier l'impact et l'urgence de chaque risque et de donner la priorité aux plans de continuité organisationnelle pour les zones opérationnelles les plus critiques », a-t-elle ajouté. « Le plus important à retenir, c'est que, dans les années à venir, les DSI des entreprises du monde entier ont de fortes chances d'être confrontés à une panne de FAI comme celle de Rogers. C'est la raison pour laquelle ils doivent impérativement renforcer les systèmes redondants et préparer sans attendre des plans d'urgence, pour minimiser et atténuer l'impact inévitable de ces pannes de communication sur l'entreprise ».
Article rédigé par
James Careless, IDGNS (adaptation Jean Elyan)
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire