El Portal de las Tecnologías para la Innovación

Redefiniendo el borde: estableciendo nuevos estándares para la infraestructura de IA

La proximidad al borde está impulsando la necesidad de una infraestructura de IA distribuida, interconectada y escalable.

El rápido avance de la IA está transformando las industrias. Las empresas actuales necesitan rapidez en la toma de decisiones, resiliencia operativa y experiencias personalizadas para mantener su ventaja competitiva. También necesitan satisfacer las cambiantes expectativas de los consumidores y las empresas para un rendimiento aceptable.

La infraestructura de IA basada en proximidad en el borde es esencial para cumplir con estos estándares en constante evolución. El panorama de la IA está evolucionando, desde el entrenamiento de modelos de IA en ubicaciones centralizadas hasta un paradigma más distribuido que incluye la inferencia de la carga de trabajo en el borde. Esto se debe en parte al auge de la inferencia de IA agéntica , que toma decisiones en el borde y se basa en una baja latencia.

Los modelos de IA más recientes son más especializados y de menor tamaño, lo que permite el entrenamiento en el borde. Las empresas utilizan estos modelos especializados para dominios específicos porque se adaptan mejor a sectores, funciones y conjuntos de datos propietarios específicos.

Todos estos factores hacen que el borde sea una ubicación computacional más estratégica, dada su proximidad a donde se generan, almacenan y procesan los datos.

¿Dónde está tu ventaja principal?

Las empresas necesitan replantearse dónde se encuentra su ventaja competitiva. De hecho, existen múltiples ventajas competitivas donde una empresa podría optar por realizar inferencia de IA. La ventaja competitiva metropolitana está ganando terreno como una ubicación crucial para las cargas de trabajo de inferencia de IA, ya que ofrece el mejor equilibrio entre baja latencia, privacidad de datos y rentabilidad.

Elegir el perímetro metropolitano implica trasladar los datos de inferencia a una instalación diferente, como un centro de datos de coubicación, dentro de la misma área geográfica concentrada que las fuentes de datos. Este enfoque concentra las cargas de trabajo de inferencia en una única ubicación con una latencia típica inferior a 10 milisegundos y elimina la necesidad de que las empresas operen infraestructura privada dentro de sus propias instalaciones.

Los tipos de aplicación también influyen en la identificación de las ubicaciones de los bordes primarios, ya que la tolerancia a la latencia varía. Las aplicaciones orientadas a máquinas suelen requerir alta velocidad y baja latencia. En las aplicaciones orientadas a humanos, unos pocos milisegundos adicionales de retraso ni siquiera se registrarían. Un radiólogo que busca historiales médicos no necesita una respuesta inmediata, pero un coche autónomo que intenta evitar a los peatones sí.

Los requisitos específicos de la industria, como dónde se generan y procesan los datos y cómo se accede a las fuentes de datos, también determinan la ubicación del borde de una empresa. Las empresas pueden necesitar cumplir con los requisitos de latencia del borde para diversas funciones:

  • Empresas de logística : rastrean entregas, gestionan rutas de entrega, agilizan las operaciones del almacén y monitorean y garantizan la seguridad de la carga.
  • Empresas de distribución de contenidos : ofrecen recomendaciones personalizadas en tiempo real y garantizan transmisiones de baja latencia, juegos sin demoras y experiencias AR/VR inmersivas.
  • Ciudades inteligentes : utilice análisis de vídeo en tiempo real y procesamiento de datos de sensores para la gestión del tráfico, la detección de delitos y la respuesta a emergencias.
  • Organizaciones de atención médica : garanticen un monitoreo continuo, cirugías robóticas remotas sin inconvenientes y análisis rápido de datos para diagnósticos más rápidos y tratamientos personalizados.

Los casos de uso en el borde seguirán evolucionando y creciendo, lo que requerirá que las empresas diseñen tanto para el presente como para el futuro.

Para 2029, el 50 % de las empresas utilizarán computación de borde, frente al 20 % en 2024.[1]”
Gartner® predice 2025: Las plataformas de computación de borde acelerarán la IA de borde

Las decisiones sobre la ubicación de los datos afectan el costo y el cumplimiento

El lugar donde las empresas deciden ejecutar cargas de trabajo de IA y almacenar datos afecta las tarifas de salida y las estructuras de costos (OPEX vs. CAPEX). También impacta el rendimiento, la latencia y los requisitos de infraestructura de red.

El volumen de datos generado diariamente en el borde puede aumentar rápidamente. Por ejemplo:

  • Fábrica inteligente: 1 petabyte
  • Avión: 4 terabytes
  • Coche autónomo: 3 terabytes

Trasladar esos datos a una ubicación centralizada para la inferencia de IA afecta significativamente la latencia, el costo y el ancho de banda, lo que hace que el edge sea la opción obvia.

Además, las leyes de protección de datos y privacidad ya están en vigor en 144 países, y hay más en camino. [2] Algunas regulaciones son complejas y requieren una cuidadosa consideración sobre dónde almacenar los datos. Por ejemplo, no se pueden almacenar datos recopilados en Alemania en una nube de AWS en EE. UU.; deben permanecer en Alemania. Esta es una de las razones por las que se necesita una infraestructura distribuida para la IA .

Elevando el nivel de innovación en IA en la periferia

Exploremos dos ejemplos de empresas que innovan con IA en el borde e implementan infraestructura de IA para colaboración en tiempo real y conectividad de alta velocidad con clientes y socios.

Nanyang Biologics, una startup biotecnológica especializada en el descubrimiento de fármacos basado en IA, aprovechó la interconexión definida por software Equinix Fabric® para la computación en el borde y permitió la colaboración en tiempo real con sus socios de investigación. Esto aumentó la velocidad y la precisión a un menor costo.

Vea este breve estudio de caso en video de Nanyang Biologics para obtener más información sobre cómo la infraestructura de IA escalable en el borde respalda el entrenamiento de modelos de IA y acelera el descubrimiento de fármacos.

Alembic es una empresa SaaS de inteligencia de marketing que proporciona a sus clientes información basada en datos sobre sus actividades de marketing, lo que les permite optimizar el gasto y optimizar el flujo de ventas. Acercaron una infraestructura de IA a sus clientes para permitir una inferencia de alto rendimiento en el borde. Alembic también aprovechó el ecosistema de proveedores de servicios de red (NSP) de Equinix y Equinix Fabric para ofrecer conectividad de alta velocidad a sus clientes y socios, ofreciendo así un producto de mayor rendimiento.

Vea este breve estudio de caso en video de Alembic para descubrir cómo están habilitando el marketing basado en datos a través del análisis de datos impulsado por IA

Otras industrias que están innovando con IA en el borde incluyen:

  • Servicios financieros para estrategia comercial y detección de fraude.
  • Medios y entretenimiento para la creación de contenidos digitales y desarrollo de juegos.
  • Vehículos autónomos para detección de peatones y señales de tráfico y seguimiento de carriles.
  • Robótica para fabricación, construcción y navegación.

4 pasos para priorizar la proximidad en el borde

La transición a una estrategia de infraestructura centrada en la proximidad requiere un enfoque deliberado e integrado. Recomendamos seguir estos pasos para crear su hoja de ruta.

  1. Primero, audite su infraestructura de IA actual. Deberá mapear los flujos de datos e identificar los cuellos de botella de rendimiento causados ​​por la latencia.
  2. A continuación, defina sus requisitos de borde: evalúe las demandas de las aplicaciones en tiempo real, incluyendo latencia, ancho de banda y cumplimiento normativo. También deberá revisar los requisitos de su empresa en cuanto a conectividad de alto rendimiento, computación y almacenamiento de datos.
  3. Ahora está listo para diseñar una estrategia de datos flexible, multicloud y de múltiples proveedores que le permita distribuir cargas de trabajo de manera inteligente para crear el equilibrio adecuado entre infraestructuras perimetrales y centralizadas, e implementar infraestructura específica del país o de la región para lograr el cumplimiento.
  4. Por último, aproveche los ecosistemas de socios de IA neutrales e interconectados para acceder a la amplia gama de socios necesarios para respaldar las cargas de trabajo de IA.

Implemente su infraestructura de IA en el borde

La infraestructura distribuida ayuda a las empresas a acelerar la innovación en IA y a asegurar el futuro de sus estrategias de IA. Si bien en este blog nos hemos centrado en el edge, su estrategia de infraestructura de IA debe incluir una combinación de infraestructura en la nube y edge, así como una red robusta para conectar de forma segura todos sus recursos.

Los centros de datos de IA de Equinix están estratégicamente ubicados en los mercados más conectados del mundo para ayudar a las empresas a asegurar el futuro de sus operaciones. Nuestra presencia global abarca más de 270 centros de datos de coubicación interconectados en 76 áreas metropolitanas de todo el mundo, lo que garantiza el acceso a los principales proveedores de servicios en la nube a través de nuestra cartera líder en la industria de más de 220 accesos a la nube y la proximidad a múltiples fuentes de datos.

Miles de proveedores de datos, nube, redes, tecnología de IA y GPU como servicio (GPU como servicio) forman parte del sólido ecosistema digital de Equinix. Las empresas pueden usar Equinix Fabric para crear conexiones escalables y bajo demanda con socios del ecosistema y entre su propia infraestructura de IA en diferentes ubicaciones.

Para obtener más información sobre por qué es importante la proximidad, lea nuestro informe técnico La paradoja de la proximidad .

[1] “ Gartner predice 2025: Las plataformas de computación de borde acelerarán la IA de borde ”, Gartner®, 28 de noviembre de 2024.

GARTNER es una marca registrada y marca de servicio de Gartner, Inc. y/o sus filiales en EE. UU. e internacionalmente, y se utiliza aquí con autorización. Todos los derechos reservados.

[2] “ Leyes de protección de datos y privacidad ahora vigentes en 144 países ”, IAPP, 28 de enero de 2025.

Equinix Blog. K. E. Traducido al español

Artículos relacionados

OpenAI

Presentamos ChatGPT Salud

ChatGPT Salud, una experiencia diseñada para integrar de manera segura tu información médica con la inteligencia de ChatGPT, para que dispongas de más información, confianza y preparación a la hora de cuidar tu salud.

Continuar leyendo...
Scroll al inicio