COMMENT UNE ERREUR HUMAINE A CAUSE LA CHUTE DE MILLIERS DE SERVEURS WEB
Certains services web d'Amazon ont cessé de fonctionner pendant plus de quatre heures il y a quelques jours, entraînant des milliers de sites avec eux. Contrairement à l'incident de 2011, un orage magnétique n'est pas en cause. Dans la matinée du 28 février, bon nombre de services web et sites internet ont cessé de fonctionner aux États-Unis. De la plateforme de communication collaborative Slack au site participatif Quora en passant par le site "Is It Down Right Now?" dont le but est de dire si d'autres sites sont pannes, la liste est longue. Il faudra plus de quatre heures pour que l'accès complet aux serveurs Amazon Simple Storage Service (S3), qui hébergent ces services, soient rétablis. Après enquête, le géant américain a mis le doigt sur la cause du problème : une faute de frappe dans une formule de code utilisée par un technicien. "À 9h37 (18h37 heure de Paris, ndlr), un membre autorisé de l'équipe S3 utilisant une procédure standard a exécuté une commande destinée à supprimer un petit nombre de serveurs pour un des sous-systèmes S3 [...]. Malheureusement, une des entrées de la commande a été saisie incorrectement et une plus grand ensemble de serveurs que prévu a été supprimé", raconte Amazon dans un communiqué d'excuses publié sur son site. S'ensuit la pénurie massive que l'on connaît, le service d'hébergement dans le cloud Amazon Web Services comptant plus d'un million d'utilisateurs, dont des entreprises parmi les plus importantes du secteur technologique (Adobe, Netflix, Comcast notamment). Mais la panne touche aussi des startups, notamment des spécialistes de l'Internet des objets dont le matériel connecté ne fonctionne plus.