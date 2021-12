Amazon Web Services (AWS) a fourni une explication sur la cause de la panne qui a entraîné la panne de certaines parties de ses propres services, ainsi que des sites Web tiers et des plateformes en ligne qui utilisent AWS. Dans un article publié sur le site Web d’AWS, la société explique qu’un processus automatisé a provoqué la panne, qui a commencé vers 10 h 30 HE dans la région de Virginie du Nord (US-EAST-1).

Le pic de congestion a empêché l’équipe d’exploitation de l’entreprise d’utiliser son système de surveillance en temps réel

« Une activité automatisée pour faire évoluer la capacité de l’un des services AWS hébergés dans le réseau AWS principal a déclenché un comportement inattendu de la part d’un grand nombre de clients au sein du réseau interne », indique le rapport d’Amazon. « Cela a entraîné une forte augmentation de l’activité de connexion qui a submergé les périphériques de mise en réseau entre le réseau interne et le réseau AWS principal, entraînant des retards de communication entre ces réseaux. »

Selon le rapport, ce problème a même eu un impact sur la capacité d’Amazon à voir exactement ce qui n’allait pas avec le système. Cela a empêché l’équipe d’exploitation de l’entreprise d’utiliser le système de surveillance en temps réel et les contrôles internes sur lesquels ils s’appuient généralement, ce qui explique pourquoi la panne a pris si longtemps à être corrigée. Amazon note que le démarrage du service n’a commencé à s’améliorer qu’à 16 h 34 HE et que le problème a été entièrement résolu à 17 h 22 HE.

Étant donné que le centre de contact d’assistance d’Amazon fonctionne également sur le réseau AWS, les clients n’ont pas pu créer de demandes d’assistance pendant sept heures pendant la panne. Le tableau de bord Service Health d’Amazon, que la plate-forme utilise pour fournir des mises à jour de statut, a également été affecté, ce qui a retardé la reconnaissance du problème par Amazon. La société dit qu’elle travaille sur un moyen d’améliorer sa réponse aux pannes et prévoit de publier une version remaniée du tableau de bord de santé du service qui devrait aider les clients à recevoir des mises à jour en temps opportun en cas de panne.

En plus de supprimer des services populaires, comme Venmo, Tinder, Disney Plus et même Roomba, la panne du 7 décembre a également suspendu certaines livraisons d’Amazon. Amazon a connu sa dernière panne majeure à la même époque l’année dernière, provoquant la panne d’un certain nombre de sites et d’applications pendant des heures.