Le site de réservation de logements Airbnb, le site communautaire Reddit, les jeux vidéo en ligne Roblox et Brawl Stars, des applications populaires comme Slack, Snapchat et Fortnite… Une partie de l’Internet mondial et des applications au cœur du quotidien de millions de personnes se sont grippés lundi pendant plusieurs heures, après une panne aux Etats-Unis d’Amazon Web Services (AWS), la plateforme cloud d’Amazon.

Peu avant minuit, soit au bout d’une quinzaine d’heures de gestion de crise, le propriétaire de cette épine dorsale de l’informatique en ligne a annoncé avoir complètement résolu la panne et s’attendre « à un rétablissement total (…) dans les deux prochaines heures », le temps de traiter la file d’attente.

Cette défaillance, synonyme de paiements bloqués, de livraisons interrompues et d’autres activités professionnelles ou privées empêchées, a illustré la dépendance du monde aux infrastructures des géants de la tech américains.

Filiale d’Amazon, AWS est une plateforme d’informatique à distance (cloud) qui fournit aux entreprises des services à la demande comme le stockage, les bases de données ou l’IA. Elle pèse près d’un tiers du marché mondial de ce secteur en pleine expansion, sous l’essor rapide de l’intelligence artificielle, devant ses concurrents eux aussi américains, Microsoft Azure et Google Cloud, qui se partagent le deuxième tiers, selon le cabinet Synergy Research Group.

Cette panne « met en évidence les défis liés à la dépendance » aux fournisseurs de services basés à l’étranger comme Amazon, Microsoft et Alphabet (Google), et qui concentrent une partie importante des clients dans le monde, estime Junade Ali, expert en cybersécurité à l’IET (Institution of Engineering and Technology), au Royaume-Uni.

Elle soulève « de sérieuses questions » sur la pertinence pour les entreprises « d’externaliser tout ou partie de leur infrastructure essentielle à un petit groupe de fournisseurs tiers afin de réaliser des économies sur l’hébergement », pointe l’analyste financier britannique Michael Hewson.

« Cette dépendance excessive à l’égard d’un seul fournisseur menace désormais plus que la simple disponibilité des services : elle met en péril la réputation de la marque et la confiance des clients », a souligné Gadjo Sevilla, analyste chez Emarketer, évoquant la nécessité pour les clients d’AWS de prévoir des stratégies de redondance, synonymes de coûts financiers et énergétiques supplémentaires.

Dans un premier temps, AWS avait attribué la panne à un problème, vite résolu, de DNS, le système de noms de domaine des sites Internet, celui qui permet aux requêtes informatiques d’être guidées jusqu’à la bonne destination.

Mais les heures suivantes, après une accalmie, ont vu les difficultés reprendre, faisant de nouvelles victimes aux Etats-Unis autour de 17 heures, comme le jeu Battlefield, la compagnie aérienne Delta ou le service de paiement en ligne Venmo, très populaire dans le pays. AWS a alors annoncé sur son site vers 18 heures (heure de Paris) que « la cause profonde [était] un sous-système interne chargé de surveiller le bon fonctionnement des répartiteurs de charge réseau ». Autrement dit, la défaillance, non encore expliquée, ne concerne pas seulement le système de navigation mais la tour de contrôle.

Pour éviter qu’une panne n’affecte tout le réseau, AWS a pourtant découpé le monde en une quarantaine de régions, disposant chacune de trois structures distinctes et isolées, pouvant pallier la défaillance de l’une ou l’autre. Mais l’incident de lundi a démontré qu’un certain nombre de requêtes fondamentales continuent de passer par les centres de données de la région nommée US-East-1, centre le plus ancien (2006) et le plus important d’AWS, situé dans le nord de la Virginie.

En juillet 2024, une autre panne informatique, liée à la mise à jour d’un logiciel de CrowdStrike sur Windows, avait paralysé des aéroports, des hôpitaux et de nombreuses autres organisations, provoquant une gigantesque pagaille à travers le monde. D’après Microsoft, environ 8,5 millions d’appareils avaient été touchés par cette défaillance, les utilisateurs étant confrontés à des « écrans bleus de la mort » qui rendaient le redémarrage impossible.

Recomendar A Un Amigo
  • gplus
  • pinterest
Commentarios
No hay comentarios por el momento

Tu comentario