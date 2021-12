Les pannes de service cloud ne sont pas nouvelles. Cependant, le passage de 2020 au travail à domicile a exposé des tonnes de vulnérabilités, car les opérateurs, les entreprises de câble et de fibre optique et toutes les applications populaires sous le soleil ont connu un effondrement temporaire et catastrophique. Cela a imposé une charge sans précédent sur les systèmes d’infrastructure cloud qui soutiennent vos sites de streaming et de productivité préférés. Ces pannes étaient une conséquence inévitable.

Vous auriez espéré que 2021 montrerait une nette amélioration. Au lieu de cela, cela a prouvé qu’Internet est un jeu de cartes prêt à s’effondrer si la mauvaise pièce fondamentale se plie. Que ce soit en raison de la frugalité ou d’une mauvaise planification, de nombreux sites mettent toutes leurs données et leurs œufs de trafic dans un même panier cloud ; une seule défaillance de nœud peut éliminer certains des sites les plus fréquentés, alors que nous nous attendons à ce que ces sites aient de bien meilleures contingences en place.

Nous avons vu nos applications de messagerie préférées, nos maisons intelligentes, nos réseaux de jeux, nos suites de productivité et nos sites de médias sociaux s’effondrer à un moment ou à un autre cette année. Au-delà de cela, les pannes d’Amazon Web Services (AWS) et de Facebook ont ​​prouvé à quel point notre vie quotidienne dépend du cloud, de la technologie de la maison intelligente à nos livraisons de colis.

En repensant aux pires pannes de 2021, nous ne pouvons qu’espérer que les choses s’améliorent en 2022. Mais il n’y a aucune raison de supposer qu’elles le feront à moins que les entreprises d’infrastructure cloud et les réseaux de diffusion de contenu (CDN) ne changent leur façon de faire les choses – et à moins que les entreprises commencent à ajouter hors ligne fonctionnalité à la technologie basée sur le cloud.

1. La panne d’AWS arrête les livraisons, les caméras et les mangeoires pour chats

La récente panne d’AWS en décembre est probablement encore fraîche dans votre esprit. Amazon Web Services exécuterait environ 33 % des services d’infrastructure cloud. Ainsi, lorsque AWS s’est effondré le 7 décembre, il a peut-être emporté avec lui environ un tiers des services cloud.

Selon l’équipe AWS, le réseau interne AWS pour la surveillance, le DNS interne et les services d’autorisation a en quelque sorte déclenché une « grande augmentation de l’activité de connexion qui a submergé les périphériques réseau entre le réseau interne et le réseau AWS principal, entraînant des retards de communication entre ces derniers. réseaux. » Étant donné que ce réseau interne est lié aux serveurs AWS mondiaux, il a provoqué des retards de trafic ou des fermetures totales de sites à l’échelle internationale pendant environ 7 heures jusqu’à ce que les développeurs puissent réparer le réseau interne.

Pendant les achats des Fêtes, les applications des chauffeurs-livreurs d’Amazon avec les itinéraires et les adresses sont tombées en panne, les laissant incapables d’effectuer les livraisons. Les consommateurs ne pouvaient pas non plus passer de nouvelles commandes Amazon, ce qui signifie que les entreprises ont manqué près d’une journée de revenus. Les services Amazon propriétaires – Alexa, caméras Ring, Prime Video et Music – ont tous été interrompus, ce qui signifie que leurs sonnettes vidéo intelligentes et leurs moniteurs pour bébé sont devenus temporairement sans valeur. Et les applications tierces populaires comme Disney+, Venmo et iRobot sont toutes tombées en panne grâce à leur choix de fournisseur de cloud.

Selon CNBC, les effets de la panne d’AWS se sont même répercutés pour perturber les examens finaux dans les collèges, car certains services d’examen s’appuyaient sur le cloud pour fonctionner. Même certaines mangeoires automatiques « intelligentes » ont cessé de nourrir leurs chats pour la journée.

À la suite de cette panne, les lecteurs d’Android Central ont déclaré qu’ils étaient plus méfiants qu’auparavant à propos de la technologie de la maison intelligente dépendante du cloud. Et tandis que les experts pensent qu’Amazon doit incorporer des contrôles hors ligne dans sa technologie de maison intelligente, ils pensent également que c’est peu probable. Encore une fois, c’est parce que le cloud leur permet de vendre une technologie bon marché et sous-alimentée qui n’aurait pas la capacité de fonctionner sans elle.

2. Le méta-verset s’effondre

Source : Nick Sutrich / Android Central

Si nous parlons des pannes les plus salissantes de 2021, nous devons mentionner Facebook. Juste avant son changement de nom Meta, Facebook a accidentellement fermé ses propres services cloud en raison de « modifications de configuration sur les routeurs backbone qui coordonnent le trafic réseau entre nos centres de données », qui ont mis en cascade et arrêté tous leurs services en ligne. Il a veillé à ce que personne ne puisse accéder aux services Meta dans le monde, y compris ses propres employés.

Même si les serveurs cloud de Meta n’alimentent que ses propres entreprises comme Facebook, Instagram et Whatsapp, cette panne a quand même eu des répercussions sur d’autres entreprises. Tous les sites dépendant des connexions Facebook sont devenus inaccessibles à leurs utilisateurs, tandis que d’autres sites d’achat ou jeux dépendant des serveurs ou des jetons de Meta se sont également fermés.

De plus, bien sûr, cette panne de Facebook a miné ses propres périphériques alimentés par le cloud. Les propriétaires de Quest 2 ne pouvaient plus accéder à leur bibliothèque de jeux en raison de l’exigence d’un compte Facebook, tandis que les lunettes intelligentes Ray-Ban Stories ont perdu leur intelligence. Nous avons commenté à l’époque que Facebook devait ajouter un support hors ligne pour sa technologie à l’avenir.

Surtout, la panne de Whatsapp de 6 heures s’est avérée le pire fiasco pour l’entreprise. Pour les millions de personnes qui utilisent l’application comme principal moyen de communiquer avec leur famille, même une seule journée sans elle était une journée de trop. Après la panne, Telegram aurait obtenu 70 millions de nouveaux membres. Cela ne signifie pas nécessairement que Whatsapp a perdu autant d’utilisateurs, mais il a certainement connu un exode important qu’il pourrait ne jamais regagner.

Whatsapp, Facebook et Instagram ont connu une panne similaire en avril 2021, bien que celle-ci n’ait duré que 45 minutes.

3. Supprime rapidement Internet

Quand quelque chose fonctionne, vous n’y prêtez pas attention. Ainsi, beaucoup de gens n’avaient jamais entendu parler du réseau de diffusion de contenu (CDN) de Fastly jusqu’à sa rupture en juin, entraînant avec lui certains des sites Web les plus populaires.

Un CDN permet de mettre en cache le contenu pour des temps de chargement plus rapides et une charge de bande passante réduite sur les serveurs d’hébergement, c’est pourquoi tant d’entreprises leur font confiance. Ils fournissent des données à grande vitesse dans le monde entier, garantissant que les données sont transférées vers différents emplacements dans le monde pour réduire les temps de chargement, quel que soit le lieu de résidence de l’utilisateur.

Mais dans le cas de Fastly, une configuration de service défectueuse « a déclenché des perturbations sur nos POP dans le monde », ce qui a nui aux sites qui dépendaient de son informatique de pointe. Plus précisément, des sites comme Amazon, Twitter, Reddit, Google, CNN, le Guardian et le New York Times ont tous été lancés en même temps début juin. Rapidement restauré « 95 % » de ses services en 49 minutes, ce qui en fait une panne étendue mais relativement courte par rapport au reste.

4. Quatre pannes de PSN pour une année PS5 désordonnée

Source : Android Central

En supposant que vous ayez réussi à acheter une PS5 cette année, vous avez probablement rencontré des problèmes pour accéder à votre bibliothèque ou jouer à des jeux multijoueurs à un moment donné en 2021. Sony et CDN Akamai Technologies ont fait face à plusieurs pannes tout au long de l’année.

La panne PSN la pire et la plus prolongée s’est produite de fin février à début mars, garantissant que certains joueurs PS5 et PS4 ne pouvaient pas accéder sporadiquement à leurs bibliothèques de jeux pendant plusieurs jours.

Pourtant, trois autres pannes au cours des mois suivants ont indiqué que Sony avait des problèmes de réseau fondamentaux à résoudre. Dans chaque cas, les joueurs du monde entier rencontreraient des messages d’erreur concernant la maintenance lors de l’accès aux services en ligne, avec des pannes pouvant durer de 1 à 5 heures.

Parmi les meilleurs jeux PS5, beaucoup nécessitent des connexions en ligne constantes ou tournent autour du multijoueur. Si Sony ne peut pas non plus maintenir son service PSN fonctionnel pendant plusieurs jours en 2022, cela ne manquera pas de rendre ses fidèles fans mécontents.

5. Google ne peut pas aider ses clients Smart Home

Notre première panne majeure de 2021 est survenue en février grâce à l’amnésie soudaine de Google Assistant. Si vous essayez de poser une question à votre enceinte Nest ou Google Home, on vous dira que « l’appareil n’est pas encore configuré » malgré toutes les preuves du contraire. Cela rendait impossible la connexion à vos appareils Google Home associés à votre compte, des lumières intelligentes à la technologie de sécurité Nest. De plus, l’application Android Google Assistant a également eu des problèmes pour répondre aux questions.

Cela a semblé avoir un impact sur tous les utilisateurs de Google Home ce soir-là, les utilisateurs se rendant sur Reddit et les forums d’assistance pour obtenir de l’aide. Google a résolu le problème ce soir-là, quelques heures après que le problème est devenu largement connu, bien que l’on ne sache pas exactement quand il a commencé.

6. La maison intelligente de Wink fait un clin d’œil

Source : clin d’oeil

La plupart des pires pannes de 2021 ont affecté un large éventail de sites pendant une période relativement courte. Le prix du vrai pire Cependant, la panne de l’année revient à Wink Hubs, qui a fermé ses portes pendant 10 jours. En raison de leur nouvelle dépendance à l’égard des services cloud pour fonctionner, ces hubs ne pouvaient plus du tout contrôler les produits Zigbee ou Z-Wave, les rendant presque sans valeur.

Wink a offert une remise de 25 % sur ses frais d’abonnement en guise d’excuse, mais à notre connaissance, il n’a jamais réellement expliqué la cause du problème – en déclarant seulement qu’il « optimiserait le Wink Backend et notre API maintenant qu’il est sauvegardé ». De nombreux clients ont vu dans cette panne le signe qu’il était temps d’abandonner définitivement Wink.

7. Le système de notifications d’exposition Android devient kaput

Source : Android Central / Alex Dobie

En ce qui concerne la recherche des contacts et la prévention de l’exposition au COVID-19, tout retard dans la connaissance de votre état peut entraîner une propagation et une maladie supplémentaires. Ainsi, lorsque l’application NHS COVID-19 a échoué en raison de problèmes avec le système de notifications d’exposition Android dans le backend de Google, ce n’était pas une bonne idée pour Google.

Les personnes souhaitant vérifier leur statut ont trouvé un écran « Chargement » indéfini. Google a annoncé qu’il examinerait le problème après environ 12 heures de rapports de bogues, puis a pris 5 à 6 heures supplémentaires pour résoudre le bogue. Ajoutez le problème effrayant de « notification fantôme » de 2020 – des notifications incorrectes indiquant que les utilisateurs ont été exposés à COVID-19 apparaîtraient, puis disparaîtraient avant que vous puissiez appuyer dessus – et les gens avaient de nombreuses raisons de se méfier de l’application à ce stade.

8. Redondance des pannes AWS

Source : Android Central

Après la panne majeure d’AWS le 7 décembre, nous avons assisté à une deuxième panne AWS le 15 décembre causée par des problèmes dans les installations Amazon Web Services d’Amazon en Oregon et en Californie du Nord. Cette fois, il a supprimé Twitch, DoorDash, Xbox Live, PSN, Ring, Disney+ et T-Mobile.

Ensuite, nous avons assisté à une troisième panne AWS le 22 décembre qui a fermé Fortnite, Hulu, Quora, Slack et Imgur. Dans ce cas, une panne de courant dans une installation de la côte est a causé le problème. Cela a donc fait trois pannes en trois semaines. Les deux dernières pannes n’ont duré qu’une heure environ, bien que ce soit certainement assez long pour causer des problèmes.

Le problème des pannes diminuera-t-il ou augmentera-t-il en 2022 ?

Ces différents événements montrent à quel point notre système actuel dépendant du cloud peut être fragile. Avec une grande partie de notre utilisation d’Internet concentrée sur quelques applications et services – dont la plupart utilisent quelques grands fournisseurs d’infrastructure cloud – une seule crise peut paralyser notre productivité ou rendre notre technologie coûteuse inutile.

Peut-on espérer moins de mésaventures l’année prochaine ?

Source : Google

Pour voir moins de pannes, nous aurions besoin de voir plus d’investissements dans l’infrastructure cloud. Le récent projet de loi sur les infrastructures a alloué des milliards de dollars à l’amélioration de l’accès haut débit et haut débit en milieu rural et à la cybersécurité civile, mais la plupart des pires pannes de 2021 sont dues à des erreurs d’entreprise et non à des acteurs hostiles. Nous devrons donc peut-être compter sur (ou faire pression) sur les entreprises pour qu’elles investissent elles-mêmes davantage dans l’infrastructure cloud.

Dans l’état actuel des choses, Gartner prévoit que les entreprises dépenseront 482 milliards de dollars en services cloud en 2022, soit une augmentation de 21,7%. Cela devrait au moins être un pas dans la bonne direction.

Il est important de noter que bon nombre des pires pannes provenaient des réseaux de surveillance internes des entreprises ou de CDN tiers, et non des serveurs principaux. Les systèmes mêmes destinés à surveiller et à prévenir les pannes peuvent faire tomber l’ensemble du système dans de mauvaises circonstances, où l’erreur humaine peut avoir des conséquences disproportionnées. Et bien que les CDN soient essentiels pour fournir le trafic le plus rapide possible, ils ajoutent une étape potentielle supplémentaire où quelque chose peut mal tourner.

Lorsqu’un seul nœud, serveur ou centre de données peut renverser le système, peu importe le montant que vous investissez. Pour que les pannes majeures diminuent en 2022, nous avons besoin que les entreprises structurent mieux leurs données, afin que les sauvegardes puissent démarrer rapidement jusqu’à ce que le nœud problématique soit corrigé. Nous sommes en bien meilleure forme qu’il y a deux ans, mais nous avons encore un long chemin à parcourir avant que les pannes deviennent moins persistantes.

