La creación de una base escalable ayuda a las empresas a acelerar la preparación para la IA y una infraestructura preparada para el futuro para el crecimiento de la IA
El rápido crecimiento de los datos de IA (en las cargas de trabajo de entrenamiento e inferencia y en todos los puntos intermedios) está aumentando la demanda de una infraestructura informática de alto rendimiento. Además, las aplicaciones de IA complejas y con uso intensivo de datos requieren una conectividad multicloud híbrida para permitir transferencias de datos más rápidas entre cargas de trabajo críticas.
Las empresas se enfrentan a la falta de capacidad de procesamiento y potencia, capacidades de refrigeración de alta densidad y la infraestructura escalable necesaria para soportar las cargas de trabajo de IA, ya que sus centros de datos locales están obsoletos. Se enfrentan a un panorama de IA complejo impulsado por necesidades empresariales específicas y consideraciones de residencia de datos, privacidad y soberanía. Si bien las nubes públicas pueden ser una opción para alojar proyectos de IA, las preocupaciones sobre la privacidad, la dependencia de un proveedor y los costos impredecibles a menudo superan los beneficios para las empresas.
Los centros de datos preparados para IA proporcionan la infraestructura informática de alto rendimiento y la conectividad de red segura que las empresas necesitan para soportar cargas de trabajo de IA de alta densidad y alto consumo de energía, y acelerar el entrenamiento de modelos, la inferencia de IA y el movimiento de datos. Las empresas pueden garantizar la escalabilidad, la confiabilidad y la eficiencia de su infraestructura de IA geográficamente dispersa, al mismo tiempo que optimizan los costos y mantienen una seguridad y un cumplimiento sólidos.
Encuesta de tendencias tecnológicas globales de Equinix para 2023
Los beneficios y desafíos de las nuevas tecnologías digitales y estrategias de preparación para el futuroDESCARGAR AHORA
¿Cuáles son los 3 tipos principales de cargas de trabajo de IA?
Dado que las definiciones a menudo pueden variar para los términos asociados con las tecnologías emergentes, comenzaremos describiendo las tres cargas de trabajo principales que admite la infraestructura de IA.
El entrenamiento de modelos de IA implica la aplicación de algoritmos a conjuntos de datos grandes y diversos para establecer el reconocimiento de patrones y extraer información significativa. Esto permite la creación de modelos que pueden tomar decisiones o predicciones de forma autónoma y ejecutar tareas con poca o ninguna intervención humana. Algunos ejemplos incluyen la automatización de tareas de relación con los clientes y la detección de señales de malware.
- El ajuste de modelos de IA es un subconjunto del entrenamiento de modelos que toma un modelo de IA grande y previamente entrenado y lo ajusta con datos adicionales específicos de la tarea para crear una versión personalizada del modelo de IA original adaptado a un trabajo, industria o contexto específico. Por ejemplo, el modelo ajustado puede adoptar un tono de voz único o aprender los detalles intrincados de una industria como los servicios legales o los informes financieros.
La inferencia de IA introduce datos actuales en un modelo de IA para extraer nuevas conclusiones sin incluir ejemplos de los resultados deseados. Implica hacer predicciones basadas en el reconocimiento de patrones establecido durante la fase de entrenamiento. Por ejemplo, un modelo entrenado sobre el desempeño pasado del mercado puede inferir el desempeño futuro del mercado. O la inferencia de IA puede utilizarse para la detección de fraudes. Acceder a los datos más actualizados disponibles y utilizarlos es crucial. Esto significa que el modelo de IA debe estar ubicado cerca de los usuarios en el borde digital para lograr la inferencia más precisa.
- La generación aumentada por recuperación (RAG) es un enfoque que cada vez utilizan más empresas para mejorar la precisión de los resultados de las consultas de IA generativa mediante el uso de datos más actualizados. En lugar de volver a entrenar el modelo, esta técnica aumenta el modelo consultando una base de datos vectorial, lo que mejora el resultado al proporcionar datos de contexto más relevantes como parte de la solicitud de entrada.
Los datos en movimiento se refieren a la transferencia y el intercambio de datos necesarios para completar un modelo con la cantidad correcta de datos relevantes. Esto incluye el traslado de datos hacia y desde cargas de trabajo de entrenamiento e inferencia. Los datos en movimiento son fundamentales para la mejora de los modelos a lo largo del tiempo. A medida que se infieren los datos, estos también se pueden reintroducir en versiones futuras para crear un ciclo de retroalimentación continuo. Los datos se pueden distribuir dentro de regiones, en múltiples nubes o adquirirse de ecosistemas de IA, incluidos los mercados de IA .
Satisfacer los requisitos de carga de trabajo de IA con una infraestructura de IA flexible
Cada una de las cargas de trabajo analizadas anteriormente requiere una infraestructura de IA implementada dentro de centros de datos de alto rendimiento. Por ejemplo, las cargas de trabajo de entrenamiento de modelos de IA, inferencia y datos en movimiento necesitan los siguientes componentes de infraestructura:
- Conectividad de red multicloud escalable para transferencias rápidas de datos y conexiones privadas con proveedores de servicios, clientes, socios y ecosistemas de IA
- Capacidades de enfriamiento avanzadas, incluido enfriamiento líquido directo al chip, para administrar el exceso de calor generado por el procesamiento de alta densidad.
- Acceso a la nube a los principales proveedores de servicios en la nube para una conectividad perfecta con múltiples proveedores en múltiples ubicaciones
- Los entornos de IA de alto rendimiento ubicados cerca de donde se generan los datos permiten a los clientes mantener la propiedad de sus datos y cumplir con los requisitos de soberanía y privacidad de los datos.
Las cargas de trabajo de entrenamiento de modelos de IA requieren acceso a GPU para obtener una potente capacidad de cómputo y fuentes de alimentación avanzadas y confiables.
Las cargas de trabajo de inferencia de IA pueden ejecutarse en GPU y CPU menos potentes y más rentables que normalmente se implementan en centros de datos de colocación en el borde, para garantizar la proximidad a los usuarios y las fuentes de datos.
Otros servicios de valor añadido para la infraestructura de IA incluyen:
- Asociaciones de servicios gestionados que ayudan a las empresas a escalar sus operaciones de infraestructura al nivel de rendimiento de IA que necesitan para desarrollar y ejecutar modelos masivos. Estos servicios también agilizan la instalación y el funcionamiento de infraestructuras privadas y la implementación de servicios en centros de datos de coubicación preparados para IA.
- El monitoreo del entorno en tiempo real proporciona datos de consumo de energía, ambientales, mecánicos y de funcionamiento eléctrico. Esto es especialmente importante para entornos refrigerados por líquido donde los caudales y las temperaturas de la unidad de distribución de refrigeración (CDU) deben monitorearse y mantenerse activamente.
Ejecución de cargas de trabajo en el tipo adecuado de centro de datos preparado para IA
Una vez que las empresas identifican sus requisitos de infraestructura de IA, el siguiente paso es implementarla en un entorno de centro de datos preparado para IA con las capacidades de computación, refrigeración, red y almacenamiento más adecuadas. Según el tamaño de la carga de trabajo, las empresas pueden ejecutar sus cargas de trabajo en centros de datos preparados para IA, incluidos los centros de datos de hiperescala, de coubicación y de borde .
¿Qué centros de datos son adecuados para el entrenamiento de modelos?
Las cargas de trabajo de entrenamiento de modelos de IA no son sensibles a la latencia, por lo que los centros de datos de hiperescala o de coubicación pueden admitir estas cargas de trabajo.
Los proveedores de nube y SaaS que entrenan modelos de lenguaje de gran tamaño (LLM) con conjuntos de datos masivos pueden beneficiarse de la alta capacidad de los centros de datos a gran escala. Estas instalaciones suelen estar en áreas remotas, donde los precios de la energía y los bienes raíces son más bajos, por lo que pueden ofrecer espacio y energía a un costo eficiente.
Los centros de datos de coubicación tradicionales ubicados en áreas metropolitanas densamente pobladas son adecuados para cargas de trabajo con requisitos de capacidad de tamaño mediano, incluidas las empresas que capacitan modelos para su propio uso privado.
¿Qué centros de datos son adecuados para la inferencia de IA?
Las cargas de trabajo de inferencia de IA requieren los datos más recientes disponibles (a menudo, datos en tiempo real), especialmente cuando están vinculados a análisis predictivos o transacciones de mercado de alta frecuencia. La baja latencia puede ser fundamental para que aplicaciones como la conducción autónoma logren la inferencia más precisa. Sin embargo, para un chatbot, la latencia está vinculada a lo que es necesario para las interacciones con los humanos, lo que la hace menos crítica. Otra consideración es si es más rentable ubicar las GPU y las CPU en el borde, en lugar de transportar los datos a un centro de datos metropolitano. Por lo tanto, las empresas deben implementar infraestructura en centros de datos en el borde, cerca de donde se generan los datos.
¿Cómo pueden los centros de datos soportar datos en movimiento?
Las cargas de trabajo de datos en movimiento implican que los datos se muevan de forma segura de un lado a otro entre diferentes centros de datos y proveedores de la nube. Por lo tanto, es esencial que las empresas y los proveedores de servicios elijan centros de datos que ofrezcan opciones de conectividad sólidas y seguras para garantizar que sus datos nunca tengan que atravesar Internet, incluso cuando se conectan a nubes públicas. Independientemente de si se trata de hiperescala o de coubicación, un centro de datos no puede estar realmente preparado para la IA a menos que esté conectado a otros centros de datos.
Cómo la interconexión pone los datos en movimiento de forma privada y segura
Cuando las empresas transfieren sus datos a un lugar central para realizar capacitaciones en infraestructuras de su propiedad o intercambian datos con otras empresas, desean hacerlo de manera privada. La interconexión es una capacidad de red virtual que hace posible la transferencia y el intercambio privados de datos al conectar empresas, socios, clientes, empleados y otras entidades simultáneamente.
Equinix Fabric® , nuestra solución de redes virtuales para interconexión, permite a los clientes conectar de forma rápida y sencilla cargas de trabajo de IA que se ejecutan en diferentes ubicaciones. Pueden conectarse con socios y proveedores de servicios en ecosistemas de IA, incluidos mercados de IA, que ofrecen fuentes de datos adicionales que las empresas pueden usar para el entrenamiento de modelos de IA.
La implementación de la infraestructura de IA en los centros de datos de coubicación Equinix IBX® preparados para IA, ubicados estratégicamente en más de 70 áreas metropolitanas en seis continentes, permite un entrenamiento y una implementación más rápidos de los modelos de IA y permite que los datos permanezcan dentro del país para cumplir con las normas de soberanía de datos y privacidad. Nuestra plataforma independiente del proveedor y las rampas de acceso a la nube de baja latencia permiten una conectividad multicloud híbrida sin inconvenientes para la flexibilidad de la ubicación de la carga de trabajo de IA en múltiples ubicaciones.
Con la ayuda de los centros de datos de alto rendimiento de Equinix, las empresas están reduciendo la latencia, aumentando la rentabilidad y preparando sus operaciones para el futuro. Para obtener más información, lea el Perfil de proveedor de IDC: Equinix experimenta un fuerte crecimiento impulsado por la inteligencia artificial, la hiperescala y la infraestructura digital . [1]
Equinix Blog. A. D. y E. S. U. Traducido al español