Tecnología de la UOC

Infraestructura tecnológica

La disponibilidad de los servicios

Servicios

La UOC está en funcionamiento las 24 horas del día de los 365 días del año. Por este motivo, es muy importante para la Universidad garantizar que todos los servicios importantes funcionan correctamente durante todo el tiempo.

Por eso, para conseguir la máxima disponibilidad seguimos distintas estrategias:

Infraestructura con sistemas redundados en alta disponibilidad, planes de contingencia, controles de calidad y sistemas de monitorización y vigilancia 24x7.

 

  • Infraestructura de alta disponibilidad

Una parte importante de los posibles puntos de fallo se duplican y de manera automática entra en funcionamiento un elemento de reserva de modo que el servicio no se ve afectado. (En muchos casos, el elemento principal y el de reserva no se diferencian, trabajando los dos a la vez con balanceo de carga.)

En los casos en los que no es posible dotar de redundancia automática al sistema, establecemos un plan de contingencia que consiste en aplicar un procedimiento que asegura la recuperación de un servicio determinado en el mínimo tiempo posible.

  • Control de calidad (los distintos entornos)

Antes de que un servicio esté disponible por el usuario, se sigue un proceso de control con el objetivo de garantizar que su funcionamiento sea el adecuado. Es decir, que sea estable y con un buen rendimiento. Para lograr esto, la UOC dispone en su infraestructura de una serie de entornos de trabajo adicionales al de producción.

Entorno de desarrollo: donde los desarrolladores generan las aplicaciones.

Entorno de pruebas: donde se hacen las pruebas de funcional.

Entorno de preproducción: donde se hacen las pruebas de integración y de carga.

 


Haz clic en la imagen para acercarla.
 
  • Contingencia de salas

Aparte de los planes de contingencia parciales de cada servicio, la UOC dispone de un plan de contingencia global en el caso de una contingencia grave en la sala de máquinas principal. En este caso, entrarían en servicio los entornos de contingencia ubicados en la sala de Tibidabo, que asumirían los servicios principales de la UOC en un corto espacio de tiempo. Para que esto sea posible, por un lado, todos los datos relevantes se replican diariamente entre la sala principal y la secundaria, y por otro, se mantienen al día los entornos de contingencia y los procedimientos necesarios para la transferencia del servicio.

Servicio 24x7

Todos los sistemas y servicios críticos de la UOC se monitorizan continuamente las 24 horas del día. El sistema de monitorización está formado por un conjunto de tests que se ejecutan continuamente y que en caso de anomalía disparan una alarma.

El servicio de 24x7 consiste en:

 

  • Parte proactiva:

Se toman medidas para minimizar el número de incidencias. Se analizan las que han sucedido y se toman medidas para que no vuelvan a suceder.

 

  • Parte reactiva:

Es la que se desencadena cuando se produce una incidencia.

Consta de hasta 4 niveles diferentes:

Nivel 0: Monitorización de infraestructura física, comunicaciones, servidores, sistemas operativos, software base, bases de datos, aplicaciones y servicios realizada con la herramienta de software libre Nagios.

Nivel 1: Resolución de incidencias procedimentadas y automatizadas.

Nivel 2: Resolución del resto de incidencias.

Nivel 3: Soporte a nivel 2.

Cada nivel entra en acción cuando el nivel inmediato anterior no ha podido resolver la incidencia.

Los tests son muy distintos, de modo que la monitorización de un servicio se hace combinando simulaciones de transacciones de usuarios con medidas de los sistemas a nivel de hardware, sistema operativo y software de aplicaciones.

 


Haz clic en la imagen para acercarla.