Evolución de las capacidades del Centro de Datos del CICESE



Ciencias de la información

¿Qué sucede cuando reúnes infraestructura de hardware, software, equipos de procesamiento, medios de almacenamiento y redes de comunicaciones, en un espacio que cumple con requerimientos físicos y de seguridad para garantizar la continuidad de los servicios de cómputo (de tecnologías de la información), en apoyo a la ciencia, la academia y al desarrollo tecnológico?

Pues al cabo de suficientes años, y si tuviste la visión de invertir con sabiduría en tu capital humano y en equipos de vanguardia, creas un centro de datos como el que tiene actualmente el CICESE (en el top 5 del ranking del sistema de centros CONACYT), el cual no solo brinda apoyo a proyectos de investigación que requieren cómputo científico o de alto desempeño, Big Data, súper cómputo o cualquier otra modalidad, sino también a las actividades académicas, a los estudiantes de posgrado y a las acciones administrativas de la institución.

De este activo estratégico para la operación del CICESE habló la M.G.T.I.C. Verónica Rico Rodríguez, responsable del Centro de Datos y Sistemas, de la Dirección de Telemática, quien informó que sus primeros antecedentes se remontan a los años setenta, cuando este centro estaba en sus inicios.

Repasar más de 45 años de historia y constatar cómo el CICESE ha gestionado de manera exitosa la utilización de recursos computacionales de vanguardia como apoyo a la investigación, es un viaje muy interesante.

Verónica Rico lo presentó en un par de minutos. Como flashazos pasaron por nosotros equipos y momentos emblemáticos: la primera Wang 700 (1972), la Nova Jumbo 1200 (1973), el primer Centro de Cálculo Electrónico del CICESE (1975), los primeros lenguajes Fortran IV, Basic, Cobol, Algol (hasta 1976); la llegada de las Prime (la 400 en 1977 y la 350 a los pocos meses) con las que se estableció la primera red de cómputo en Latinoamérica; las primeras estaciones de trabajo Apollo Domain en 1986 (y con ellas, el sistema operativo Unix), las primeras en Latinoamérica; el primer servidor y las primeras estaciones Sun Microsystems en 1988, con las que el personal de este centro diseño e instaló la primera red dorsal de fibra óptica en una institución académica mexicana (1989).

Esta red permitió conexiones vía internet (ojo: esta fue la segunda institución mexicana con conectividad a Internet -con dirección IP y dominio “cicese.mx”-) con la UNAM a través del Observatorio Astronómico Nacional, y vía satélite al Centro de Supercómputo de la Universidad de California en San Diego, en La Jolla, California.

Luego vinieron las supercomputadoras: en 1997 la primera, una Silicon Graphics Origin 2000, y en 2002 la segunda, una Sun Fire 4800. Con ellas, y con la incorporación del CICESE como socio fundador de la Corporación Universitaria para el Desarrollo de Internet (CUDI), tuvimos acceso a Internet2 y a la era del cómputo de alto desempeño. Así empezamos el nuevo milenio.

“Los equipos estaban distribuidos en diferentes edificios del campus y a veces sufrían las inclemencias del polvo y humedad. Se hacía patente la necesidad de tener todos los equipos en un lugar que tuviera condiciones óptimas para su resguardo y funcionamiento”, señala la maestra Rico.

Esto se logró holgadamente con la construcción del edificio de Telemática en la parte más alta del campus, que fue ocupado en 2003. Su diseño contemplaba un Centro de Datos; un recinto aislado, semicircular, con espacio para varios racks y con unos vitrales perimetrales preciosos, de piso a techo, que le daban un aspecto vanguardista. Un diseño moderno y audaz, sí, pero con el detalle de que, en el interior, por el efecto invernadero que se creaba, no se podía mantener la temperatura óptima.

Aún así, los racks originales se habilitaron con el primer clúster de supercómputo, y se reunieron los servidores y estaciones de trabajo que habían estado dispersos en el campus. Esto permitió hacer un mejor uso del espacio, de los recursos cómputacionales,  proteger el estado de los equipos así como ahorros en el consumo de energía.

En 2010, indicó Verónica Rico, se adquirieron los primeros equipos para virtualización, una segunda fila de racks y se instaló cableado estructurado con rejillas. La virtualización permitió que los servicios que se tenían en servidores independientes, como estaciones de trabajo, se consolidaran en máquinas virtuales. También se les dijo adiós a los vitrales perimetrales; en su lugar se construyó un muro para controlar mejor la temperatura, y en él, por fuera (seis años después), un mural: “Prometeo: el obsequio del conocimiento”.

“De hecho, en 2018 y 2019 se habilitaron mejoras en la cámara de aire del centro de datos para mantener la temperatura y la humedad ideal. Se construyeron pasillos para aislar zonas de frío y calor, y se adquirió nueva infraestructura para mantener condiciones ideales y proporcionar continuamente servicios de calidad, de manera que todos los servicios soportados en el centro de datos pudieran ofrecerse con la certeza de acceder a ellos en todo momento. Esto así, con el reforzamiento de la infraestructura de soporte”, señaló Verónica Rico.

De esta manera, a la fecha se tienen cinco sistemas de fuerza ininterrumpible para contingencia y casos de cortes de energía por parte de CFE: dos UPS de 100 KVA, tres UPS de 50 KVA en el site de Telemática, y un UPS de 15 KVA en el site de telecomunicaciones. También se tienen dos plantas de emergencia: una Selmec de 175 Kw y la otra una Ottomotores de 250 Kw.

En cuanto a sistemas de enfriamiento, explicó que al principio se tenía uno, pero como era de confort no resultaba eficiente para las necesidades del site, por lo que se buscó adquirir sistemas de precisión que permitieran controlar mejor la temperatura y humedad. Así, actualmente se tienen dos sistemas de aire acondicionado de precisión: un CompuAire de 25 toneladas y otro redundante, un CompuAire de 20 T. Se conserva también el sistema de confort para caso extremo de contingencia, y en el site de telecomunicaciones se cuenta con un sistema de precisión CompuAire de 5 T.

Para seguridad del recinto se tiene un sistema de acceso biométrico, un sistema de video vigilancia y un sistema contra incendios que utiliza el gas FM-200 que no daña a los equipos electrónicos.

También desatacó como logro importante los sistemas de monitoreo de temperatura, humedad y consumo de energía, porque se trata de un software especializado que se desarrolló en la Dirección de Telemática. “Desde diferentes equipos permite monitorear la infraestructura de soporte, ya que concentra la información de todos esos equipos en un solo punto de referencia; así los administradores pueden tener alertas de cómo se comportan los diferentes sistemas” para atender oportunamente los incidentes presentados, indicó.

Cómo nos encontramos hoy en día

La pregunta es casi obligada: ¿Y todas estas adecuaciones, para qué nos sirven? Veamos primero cómo han ido creciendo las capacidades.

En cuanto a almacenamiento, de 2008 a la fecha se puede apreciar en la siguiente gráfica:

Respecto al número de núcleos (cores) utilizados en procesamiento de cómputo de alto desempeño (HCP), el crecimiento a partir de 2010 puede verse en esta gráfica:

Verónica Rico señala: “Los cores, más que los terabytes de almacenamiento son un mejor indicador de la capacidad en cuanto HPC que tenemos en el CICESE, aunque a nivel mundial lo que hemos implantado sería considerado como capacidades 'mini' de HPC. Sin embargo, aún y cuando no se ha hecho algún estudio comparativo de HPC en los centros CONACYT o en México, el CICESE estaría entre las primeras cinco instituciones nacionales, tomando en cuenta el equipamiento y la especialización de los servicios que soporta el centro de datos, no solo en HPC”.

Esto incluye hospedaje de equipos, el cual abarca servidores de procesamiento, clústeres de HPC, sistemas de almacenamiento y equipos de comunicaciones, cuya evolución ha sido la siguiente:

2010 – 50 equipos de cómputo

2014 – 175

2015 – 290

2016 – 330

2018 – 302 (varios equipos llegaron a su fin de vida y fueron sacados del centro de datos)

2020 – 320

2021 – 320

Un aspecto importante para brindar los servicios de telemática ha sido el proceso de virtualización que se ha vivido en el centro de datos.

¿Y qué es la virtualización? La maestra Rico lo explica así: “El software de virtualización hace posible que los recursos físicos del centro de datos (el poder de procesamiento, recursos de memoria, los medios físicos de conectividad y protocolo de la red, así como los recursos físicos y lógicos de los sistemas de almacenamiento) sean desacoplados del hardware. Todos son abstraídos y presentados como recursos compartidos, de manera que en lugar de que las aplicaciones se ejecuten directamente sobre hardware, están encapsuladas en máquinas virtuales, redes virtuales y sistemas de almacenamiento virtuales. Incluso, las variantes virtuales tipo contenedores, son similares en cuanto a estructura, pero son más ligeros, más rápidos para inicializar y se enfocan a atender microservicios o aplicaciones específicas”.

Los computólogos se refieren a ellos como instancias virtuales, que es un término más general. El número de instancias virtuales utilizadas en diversos servicios de TIC es el siguiente:

2011 – 10 instancias virtuales

2012 – 22

2013 – 75

2014 – 130

2015 – 170

2016 – 230

2019 – 250

2020 – 270

2021 – 340

 

En cuanto a la conectividad, hoy en día el ancho de banda del internet académico es de 11 Gbps, mientras que para otras actividades se tiene internet comercial con 2 Gbps. Esto, además del apoyo que se brinda directamente a proyectos de investigación, ha permitido atender la creciente demanda de clases a distancia, videoconferencias, transmisiones en vivo y otras actividades que se dispararon con la pandemia desde 2020, como el trabajo a distancia con acceso a la red interna.

Otro aspecto interesante que presentó Verónica Rico es el uso de software en el centro de datos. En servidores virtualizados, dijo, 71 por ciento del software es libre (open source), 27 por ciento es propietario con licencia, y 2 por ciento es gratuito. En cómputo científico, 79 por ciento es software libre y 21 por ciento es propietario con licencia. “Lo interesante aquí es que más de 70 por ciento del software que se utiliza es libre. Esto representa un ahorro considerable en adquisición de licencias y soporte”.

Señaló también que el apoyo a proyectos en ocasiones comienza con la adquisición de equipos, pues hay investigadores que prefieren solicitar este tipo de soporte al personal de Telemática, o bien, en gestión de infraestructura, pues no quieren perder tiempo en averiguar cómo funcionan los equipos o en cómo se programan.

Entre los usuarios del Centro de Datos, destacan los megaproyectos: el metoceánico de PEMEX, el CeMIE-Geo y el CIGOM, pero la lista es grande e incluye varios de oceanografía física (relacionados con modelación numérica, clima y pronóstico meteorológico), así como proyectos que involucran las ciencias ómicas, de bioinformática o de microscopía, entre muchos más.

En lo que respecta a los servicios de TI que ofrece, la lista es bastante larga. Entre otros, incluye acceso a Internet e Internet2, cómputo científico, súper cómputo, correo, sistemas administrativos, hospedaje, HPC, BigData, telefonía, acceso a nube institucional Nimbus, VPN, web, desarrollo de sistemas, seguridad de la información, biblioteca, bases de datos, DMZ, virtualización, ERP, video conferencias, Wireless o los sistemas de la DEP.

A manera de conclusiones sobre cómo es y cómo opera el Centro de Datos del CICESE, la maestra Rico señala:

- El centro de datos tiene infraestructura y capacidad para ofrecer un servicio continuo.

- Cuenta con las medidas de seguridad físicas y de la información para protección de los activos.

- Brinda apoyo a proyectos estratégicos, académicos, a estudiantes y a las actividades administrativas de la institución.

- Brinda servicios institucionales, en especial, apoyo de conectividad a video conferencias con motivo de la pandemia.

- Se da cumplimiento a políticas TIC y de seguridad de la información emitidas por la coordinación de la Estrategia Digital Nacional de la presidencia de la república, publicadas en el DOF el 6 de septiembre de 2021. Entre sus lineamientos prioriza el uso y operación de centros de datos institucionales y en territorio nacional, por lo que se han tenido que desarrollar procesos para dar cumplimiento a esta normativa.

 

Palabras clave: Centro de Datos, Telemática, Verónica Rico, HPC

anterior