Los centros de datos a hiperescala ofrecen la enorme capacidad necesaria para respaldar la computación en la nube, el entrenamiento de modelos de IA y otras grandes cargas de trabajo.
¿Dónde está la nube? Es una pregunta sencilla, pero que relativamente pocas personas se plantean, a pesar de que la computación en la nube desempeña un papel fundamental en prácticamente todos los aspectos de nuestra vida digital moderna.
Contrariamente a la creencia popular, la nube no existe simplemente en el espacio. Es cierto que los usuarios finales pueden acceder a ella desde casi cualquier lugar, pero eso no significa que la nube en sí esté en todas partes.
En realidad, la nube está formada por servidores interconectados y otras infraestructuras que funcionan dentro de centros de datos físicos. En concreto, los proveedores de servicios en la nube dependen de un tipo particular de centro de datos para proporcionar la base de sus servicios: los centros de datos a hiperescala.
¿Qué diferencia a los centros de datos de hiperescala de los centros de datos tradicionales?
En pocas palabras, los centros de datos a hiperescala son únicos por su enorme tamaño. La mayoría de las instalaciones a hiperescala tienen 920 metros cuadrados o más, lo que proporciona un amplio espacio para alojar miles de servidores. También necesitan una red local confiable para proporcionar la energía necesaria para mantener todos esos servidores en funcionamiento. Las empresas que utilizan centros de datos a hiperescala pueden necesitar cientos de megavatios de energía en una sola implementación, en particular porque la IA ha cambiado el panorama.
El funcionamiento de tantos servidores en una sola instalación inevitablemente genera mucho calor. Por lo tanto, los centros de datos a gran escala suelen requerir capacidades de refrigeración avanzadas, como refrigeración líquida directa al chip , en particular para soportar cargas de trabajo de alta densidad, como el entrenamiento de IA.
En comparación con otros tipos de centros de datos , tiene sentido que los consumidores e incluso la mayoría de los profesionales de TI empresariales no dediquen mucho tiempo a pensar en los centros de datos a hiperescala y en su importancia. Después de todo, la gran mayoría de las organizaciones nunca tienen una razón para utilizar centros de datos a hiperescala, al menos no directamente.
¿Quién utiliza centros de datos de hiperescala?
Los centros de datos a hiperescala ofrecen enormes cantidades de espacio y energía para soportar las mayores cargas de trabajo de algunos de los proveedores de servicios digitales más importantes del planeta. Por supuesto, esto incluye a los proveedores de la nube, pero también a los principales proveedores de contenido y SaaS. Este selecto grupo de empresas constituye básicamente todo el mercado global de centros de datos a hiperescala. Se los conoce comúnmente como «hiperescaladores».
En algunos casos, estos hiperescaladores invierten grandes cantidades de dinero para conseguir terrenos y construir centros de datos para sí mismos. Esto puede ayudarlos a tener la sensación de confianza de que obtendrán la instalación exacta que satisfaga sus necesidades. En otros casos, pueden decidir aprovechar los recursos y la experiencia de un proveedor de coubicación global. Los hiperescaladores tienen los conocimientos tecnológicos suficientes para diseñar y construir sus propios centros de datos, pero no tiene sentido que lo hagan en todas las situaciones.
Al trabajar con un socio de coubicación como Equinix, los hiperescaladores pueden acceder a un servicio mayorista especializado que se adapta exactamente a sus necesidades. Siguen teniendo un papel activo en el diseño y la operación de la implementación a hiperescala que buscan. La única diferencia es que dejarán que alguien más se preocupe por comprar el terreno, administrar el proceso de construcción, adquirir la energía y cumplir con los objetivos de eficiencia y sostenibilidad .
¿Dónde se construyen normalmente los centros de datos a hiperescala?
Dado que los centros de datos a gran escala requieren mucho espacio y energía en un solo lugar, es muy común encontrarlos en lugares más remotos, donde los bienes raíces y la energía tienden a ser asequibles en comparación con las principales áreas metropolitanas. En estos lugares, también es más fácil encontrar grandes parcelas de tierra con capacidad de red en las que construir un campus interconectado con múltiples instalaciones a gran escala.
Es cierto que la construcción de centros de datos a gran escala en áreas rurales podría generar una mayor latencia, ya que el tráfico de datos tendría que cubrir distancias más largas para llegar a las instalaciones. Sin embargo, esto no suele ser un problema, ya que los proveedores de servicios tienden a utilizar centros de datos a gran escala para admitir cargas de trabajo que son menos sensibles a la latencia. Como ejemplo, consideremos cómo los centros de datos a gran escala permiten determinadas cargas de trabajo de IA .
Las cargas de trabajo de entrenamiento de modelos de IA y de inferencia de modelos tienen diferentes requisitos de infraestructura, y es mejor utilizar diferentes tipos de centros de datos para respaldarlos. El entrenamiento de modelos implica procesar enormes cantidades de datos para establecer el reconocimiento de patrones y, por lo tanto, requiere una gran capacidad de cómputo. Por otro lado, el entrenamiento no involucra conjuntos de datos en tiempo real, por lo que la latencia de la red no es una preocupación importante. Esta combinación de factores hace que los centros de datos a hiperescala sean perfectos para alojar cargas de trabajo de entrenamiento de modelos, especialmente para modelos de lenguaje grandes (LLM) con conjuntos de datos de entrenamiento particularmente vastos.
Cómo aprovechar al máximo los centros de datos a hiperescala
El hecho de que los centros de datos a hiperescala tiendan a estar alejados no significa que deban estar aislados. De hecho, garantizar la conectividad es esencial para aprovechar al máximo los centros de datos a hiperescala.
Para volver a nuestro ejemplo de IA, el entrenamiento de modelos es solo un aspecto del flujo de trabajo de IA distribuida. Las cargas de trabajo de inferencia de modelos son más pequeñas y más sensibles a la latencia, por lo que a menudo se alojan en centros de datos de coubicación ubicados estratégicamente que ofrecen una mayor proximidad a los usuarios finales. Es esencial tener una infraestructura de red de alto rendimiento para mover datos entre las ubicaciones de entrenamiento e inferencia de manera continua.
Si bien es cierto que las empresas no suelen utilizar centros de datos de hiperescala directamente, suelen ser los clientes previstos para los servicios alojados allí. Por ejemplo, las empresas que utilizan LLM de un proveedor de servicios se beneficiarían indirectamente de la capacitación de modelos que se realiza en centros de datos de hiperescala.
Las empresas rara vez se conectan a los servicios desde el interior del centro de datos de hiperescala. En cambio, el proveedor de servicios configura una extensión de red desde la instalación de hiperescala hasta donde se encuentre el cliente empresarial. Construir un nodo de red dentro de un centro de datos de coubicación cercano es una forma rápida y sencilla de hacerlo, ya que es muy probable que muchos de los clientes empresariales ya estén desplegados allí.
Por este motivo, los proveedores de servicios pueden obtener el máximo valor de la adquisición de servicios a gran escala en una plataforma global que también incluye servicios de coubicación e infraestructura digital. Por ejemplo, Equinix ofrece una plataforma integral para satisfacer las necesidades de infraestructura de los grandes proveedores de servicios y sus clientes:
- Los centros de datos de colocación Equinix IBX® están disponibles en más de 70 mercados globales en todo el mundo.
- Los centros de datos de hiperescala Equinix xScale® están disponibles en las proximidades de muchos de estos mercados de coubicación. Además, recientemente anunciamos una empresa conjunta que tiene como objetivo recaudar más de 15 mil millones de dólares en capital para financiar nuevos centros de datos xScale en los Estados Unidos.
- Nuestra cartera de servicios de interconexión incluye Equinix Fabric® , que facilita a los proveedores de servicios conectar su infraestructura distribuida y llegar a clientes en todo el mundo. Equinix Blog. K. R. Traducido al español