La Noticia Tecnológica de la Semana

Joaquín López Lérida

La caída de Gmail abre reflexiones

Posted by Kwai en 1 marzo 2009

Fecha: 1 de marzo de 2009

gmail-caidoCuando el martes 24 de febrero los usuarios de gmail de todo el mundo se quedaron sin acceder al servicio durantes 3 horas y media, una especie de conmoción técnica sacudió toda la red. Los datos concretos de este incidente fueron:

  • Hora de caída: 11,30 a 14 horas (hora española) del martes 24 de febrero de 2009. El tiempo es aproximado porque la aplicación estuvo disponible progresivamente a esa hora.
  • Servicios afectados: Gmail (mail.google.com), y algunas otras aplicaciones de las Google Apps.
  • Causa de la caída: Está totalmente contrastado que la causa de la caída se debió a efectos laterales inesperados de una nueva aplicación que trata de mantener los datos de las cuentas de correo geográficamente cercanos a sus usuarios. Cuando se trato de poner en marcha este programa durante las labores de mantenimiento rutinarias de un centro de datos de Google en Europa, se produjo una sobrecarga de otro de los centros de datos que lo dejó totalmente inoperativo. Este generó un efecto en cadena entre todos los centros de datos que hizo que el servicio estuviera suspendido unas dos horas y media. El procedimiento de seguridad de Google para este tipo de incidentes realiza la recuperación del sistema por fases, lo que motivó que el servicio volviera a estar disponible poco a poco en todo el mundo y no de golpe.

La red tardó muy poco en darse cuenta del incidente y se sucedieron reacciones en muy poco tiempo. Así en los foros de twitter, que funcionó para muchos como inesperada herramienta de correo en ausencia de gmail, se podían leer cosas como «hotmail nos salvará» o «… llega el fin del mundo, me bajo al bunker». Meneame y Digg tardaron apenas 6 minutos en publicar la noticia. Incluso con posterioridad en sitios como twitter se expanden continuamente noticias acerca de que gmail se ha vuelto a caer.

De todas maneras, no es la primera vez que Gmail experimenta problemas, de hecho ha habido ya varios incidentes en la historia de gmail, aunque posiblemente este ha sido el único que ha afectado a escala global al sistema. Asi podemos ver registros de incidentes de gmail el 11 de agosto de 2008 (sólo para los usuarios que trataban de entrar), el 21 de septiembre de 2008 (6 horas en toda Australia), borrados de cuentas que se han restablecido, etc

En mi opinión la reacción de Google al incidente ha sido modélica, en primer lugar porque consiguió arreglarlo en poco tiempo dada la complejidad del problema, y en segundo lugar porque ha tomado una serie de iniciativas de forma muy rápida para que los usuarios no pierdan confianza, a la vez que ha escuchado todas las sugerencias de la comunidad. De estos puntos destacaría:

  • En primer lugar han reconocido el fallo, y lo han calificado como importante. Creo que la credibilidad empieza por reconocer abiertamente este tipo de cosas.
  • Google está estudiando cómo situar las tareas de mantenimiento lo más alejada posible de los horarios laborables en función de las zonas geográficas. Como explican en sus propios blogs, la complejidad del sistema hace que sea imposible realizar el mantenimiento en horarios de fines de semana por ejemplo, pero tratarán de optimizar los tiempos de mantenimiento sobre todo durante la semana.
  • Ha puesto  en marcha un dashboard donde los usuarios pueden seguir el estado de todas las aplicaciones y recoger información puntual de los fallos que se produzcan y de las medidas que se están tomando para solucionarlos.
  • Aunque reconocen el fallo durante 3 horas, este fue el peor caso posible ya que la recuperación ante fallos de este tipo se realiza por fases, por lo que en general la caída fue más breve, aunque en ningún caso estuvo por debajo de 1,30 horas.

Aparte de todo esto, Google no ha interrumpido sus planes de desarrollo con gmail, y así esta misma semana ha puesto en funcionamiento la posibilidad de insertar varios archivos a un correo simultáneamente junto con las barras de estado de carga.

De todas formas este incidente pone una vez más de manifiesto algunos problemas que plantea el cloud computing. El nivel de desarrollo que tienen determinadas aplicaciones que residen en la nube y la dependencia que tienen muchas empresas de las mismas, hace pensar que incidentes de este tipo,acompañados de la posibilidad de fallos en las operadoras por ejemplo, hacen más que probable que durante un año de funcionamiento pudiera haber problemas para trabajar de 3 a 5 días, sin contar los problemas internos que puede tener la red de una empresa, que en cualquier caso se pueden producir en ambientes de cloud computing o en ambientes con instalaciones locales.

4 respuestas to “La caída de Gmail abre reflexiones”

  1. juan said

    muy buen trabajo!
    excelente pagina sigan asi, he aqui un seguidor fiel 🙂

    yo los invito a TODOS USTEDES a pasarse por mi blog y siquieren haganse seguidores 🙂

    les prometo muy buena diversion.

    pasavideos.blogspot.com
    pasavideos.blogspot.com
    pasavideos.blogspot.com
    pasavideos.blogspot.com

    chauuuu

  2. […] April 2, 2009 by identityandconsulting   La caída de Gmail abre reflexiones […]

  3. mijhail said

    ¿Què estaràn pensando en este momento los «sacerdotes» del «cloud computing»?

  4. […] https://lanoticiatecnologicadelasemana.wordpress.com/2009/03/01/gmail/ […]

Deja un comentario