Evolución y actualización del servicio IaaS

jueves 28 de enero de 2021 - 12:34 GMT+0000

El servicio IaaS empezó a ofrecerse a la comunidad universitaria como un servicio «secundario» y que se ajustaba a un determinado tipo de docencia y de área de conocimiento. Con el paso del tiempo, este servicio se ha ido consolidando hasta convertirse en un pilar para determinado tipo de docencia práctica, en la que se requieren muchas máquinas virtuales a disposición de alumnos o grupos de investigación y donde los propios profesores las pueden administrar de forma autónoma.

Desde el comienzo del curso 2020-21, el uso que se le ha dado al servicio IaaS se ha incrementado respecto a años anteriores, debido seguramente a la alerta sanitaria y por la semipresencialidad de las clases, lo que ha convertido al IaaS en una herramienta cada vez más usada para la docencia, pues permite a los alumnos realizar sus prácticas desde casa sin tener que acceder a aulas de la Universidad. En el primer cuatrimestre de este curso académico la demanda del servicio IaaS sobrepasó todo pronóstico, tanto en el número de alumnos y asignaturas como en los requisitos de las mismas. Este aumento en la demanda, casi colapsó el servicio, afectando a la calidad del mismo, lo que generó un incremento exponencial de las incidencias. En el momento en el que el Servicio TIC detectó esta tendencia buscó soluciones al problema, invirtiendo tiempo y esfuerzo para paliar esta situación lo antes posible. Poco a poco se ha mejorado gestión y las infraestructuras para adecuarlas a dichas cargas tomando medidas como las siguientes:

1.- Para garantizar el servicio en el arranque del segundo cuatrimestre, se ha implantado una medida de “apagado automático de máquinas”. De madrugada se apagarán todas las máquinas sin actividad. Esta medida no afecta a máquinas dedicadas a investigación o proyectos y el usuario siempre podrá arrancarlas de nuevo.

2.- Uno de los problemas principales detectados es la sobrecarga de máquinas por núcleo (cores de una CPU) y el tipo o familia de CPU. Se han añadido dos servidores más al clúster para obtener mejores ratios de máquinas por núcleo. También se han reemplazado tres servidores con procesadores con peor rendimiento en virtualización. Estas acciones han ofrecido una mejora significativa en servicio.

3.- Durante el inicio del cuatrimestre, el clúster se quedó sin memoria para poder arrancar nuevas máquinas virtuales, poco a poco se ha ido aumentando la capacidad de la misma en un 1TB.

4.- Otro cuello de botella que detectamos es el acceso a disco de las máquinas, ypara mejorarlo, se sustituyeron las tarjetas de red dedicadas al almacenamiento por tarjetas de red a 10G y por otro lado se adquirió una nueva cabina de almacenamiento, con lo que se aumentó el número de operaciones de lectura y escritura a disco, así como se repartió la carga.

5.- Por último se realizó un análisis del servidor que ofrece el servicio de gestión del IaaS ( iaas.ull.es ) y se decidió optimizar la base de datos, para lo que se aumentó la memoria y se reemplazaron los discos rotacionales por discos SSD. 

En resumen:

AntesDespués
Número de servidores1012
Número de cores físicos202228
Memoria2,4 TB3,2 TB + 256 GB
Servidores con la tarjeta de red a 10 Gb para almacenamiento412
Número de cabinas de almacenamiento23