En début de semaine, Amazon Web Services a été victime d’une panne qui s’est directement répercutée sur la plateforme iCloud d’Apple. Alors qu’on ignorait jusqu’à présent l’origine de la panne, Amazon annonce qu’elle est en fait liée à une erreur humaine.
Par le biais d’une note postée sur son blog, Amazon explique que la panne d’AWS est liée à une erreur humaine. L’équipe Amazon Simple Storage Service (S3) était occupée à débuguer un problème provoquant le ralentissement du système de facturation de S3, lorsqu’un membre de l’équipe a exécuté une commande incorrecte provoquant la suppression d’un ensemble de serveurs plus large que ce qui était prévu.
iCloud victime de la croissance d’AWS
En temps normal, de telles erreurs peuvent être résolus rapidement. Cependant, à cause de la croissance exponentielle d’Amazon, le processus de redémarrage des serveurs a pris plus longtemps que d’habitude. Pour éviter qu’une telle catastrophe survienne à nouveau, Amazon a pris les mesures nécessaires en ralentissant le processus de suppression des serveurs.
Un commentaire
S3 n’est pas une plateforme de paiement mais le sytème de stockage d’objet à la base de 80% des services d’Amazon. Le système qui était lent était le système de suivi de facturation (billing) de cette plateforme.