La reciente caída de Amazon Web Services (AWS) ha dejado a millones de usuarios y empresas en un estado de incertidumbre y preocupación. Este incidente pone de manifiesto la dependencia crítica de los servicios en la nube en la actualidad. Conocer los detalles sobre lo que ocurrió, sus causas y las repercusiones es esencial para entender la importancia de contar con infraestructura tecnológica confiable.
Detalles sobre la caída de AWS
El 20 de octubre, AWS, la división de servicios en la nube de Amazon, experimentó una de sus caídas más significativas en años, interrumpiendo el acceso a miles de sitios y aplicaciones a nivel global. Esta interrupción fue calificada por expertos como el apagón más impactante desde el fallo de CrowdStrike en 2024, que tuvo repercusiones en sectores tan sensibles como la banca, la salud y el transporte aéreo.
La raíz del problema se localizó en uno de los sistemas de red que gestionan Amazon DynamoDB, un servicio de base de datos NoSQL que es fundamental para manejar enormes volúmenes de datos en línea. Este fallo desencadenó una serie de errores que afectaron tanto a los servicios internos de Amazon, como Alexa y su plataforma de compras, como a un sinfín de aplicaciones externas que dependen de su infraestructura.
Momentos clave de la caída
Los primeros informes sobre la interrupción comenzaron a llegar alrededor de las 9:00 de la mañana en España (2:00 a.m. en el centro de México). La plataforma Downdetector, especializada en el monitoreo de interrupciones digitales, registró más de cuatro millones de reportes de error en las primeras horas.
AWS, a través de su página de estado, reconoció un “aumento de las tasas de error y latencias en varios servicios” que comenzó en la región de la costa este de Estados Unidos. Este problema rápidamente tuvo repercusiones globales, dada la vastedad de la infraestructura de AWS, que abarca más de 200 centros de datos en todo el mundo.
Aplicaciones y servicios afectados
El impacto de la caída de AWS fue amplio y severo, afectando a una diversidad de plataformas en múltiples sectores. Algunas de las aplicaciones más afectadas incluyeron:
- Fortnite: Uno de los videojuegos más populares a nivel mundial.
- Snapchat: La aplicación de mensajería y redes sociales que sufrió interrupciones significativas.
- Roblox: La plataforma de juegos en línea que se volvió inaccesible para muchos usuarios.
- Duolingo: La aplicación de aprendizaje de idiomas también reportó problemas de acceso.
- Canva: La herramienta de diseño gráfico en línea enfrentó dificultades en su operatividad.
- Max: La plataforma de streaming que tuvo que interrumpir sus servicios.
Además, otros servicios como Venmo, que se integra con PayPal, y la plataforma de inteligencia artificial Perplexity también se vieron afectados. En España, las entidades financieras BBVA e ING Direct y las operadoras Movistar y Orange experimentaron problemas operativos que limitaron el acceso a sus servicios. Ticketmaster, por su parte, paralizó temporalmente la venta de boletos para eventos debido a la incapacidad de procesar transacciones.
Tiempo de recuperación
Luego de más de tres horas de interrupción, Amazon comunicó que sus sistemas comenzaban a mostrar “señales significativas de recuperación” a partir de las 10:00 GMT (4:00 a.m. hora de la CDMX). Hacia el mediodía, la compañía anunció que el “problema subyacente” había sido mitigado, y que la mayoría de las operaciones estaban volviendo a la normalidad, aunque algunos servicios seguían procesando solicitudes pendientes.
Junade Ali, ingeniero de software y experto en ciberseguridad, opinó que la resolución del incidente podría llevarse a cabo de manera centralizada en pocas horas, siempre que no hubieran fallos adicionales. La recuperación total fue gradual, ya que AWS tuvo que reiniciar procesos en servicios clave como CloudTrail y Lambda.
Causas del apagón de AWS
De acuerdo con los informes preliminares, el apagón se originó en el servicio Amazon DynamoDB, que gestiona millones de solicitudes por segundo para aplicaciones a nivel global. Este fallo provocó problemas en los sistemas de DNS (Domain Name System), que son cruciales para el funcionamiento adecuado de los servicios en internet.
Expertos como el ingeniero Rimesh Patel resaltaron que eventos como este demuestran la fragilidad de la infraestructura digital contemporánea. “Una interrupción en un proveedor crítico puede generar una cascada de inestabilidad global”, advirtió. Alan Woodward, profesor en la Universidad de Surrey, también subrayó que la concentración de servicios en un reducido número de proveedores de nube, como AWS, Google Cloud y Microsoft Azure, incrementa el riesgo de parálisis digital en caso de fallos técnicos o errores humanos.
Patrick Burgess, del Instituto Chartered, enfatizó que este incidente ilustra cuán interconectados y dependientes son los servicios digitales en la vida diaria. La diversidad en las soluciones de nube se vuelve esencial para asegurar la resiliencia del ecosistema digital.
La caída de AWS no solo subraya la magnitud de su infraestructura, sino también el efecto profundo que tiene en la vida digital de millones de personas. Durante varias horas, usuarios y empresas quedaron sin acceso a servicios básicos, recordando que incluso los gigantes tecnológicos pueden experimentar fallos en un mundo cada vez más dependiente de la nube.







