El Portal de las Tecnologías para la Innovación

Ejecute su Inferencia de IA en el Borde para Desbloquear Insights Más Rápido

Implemente modelos de entrenamiento de IA en el borde para acelerar la toma de decisiones en tiempo real, de forma privada y segura

Las empresas están avanzando rápidamente en sus estrategias de IA, desde la acumulación de conocimientos hasta los modelos de capacitación. Ahora que los modelos de capacitación son más maduros, verticales y confiables, esperamos que las empresas lo hagan pase más tiempo en la inferencia de IA, particularmente en el borde.

La computación de borde para la inferencia de IA permite la toma de decisiones en tiempo real para casos de uso en muchas industrias. El procesamiento de datos a nivel local, cerca de las fuentes de datos, reduce la latencia, garantiza el cumplimiento y permite a las organizaciones reaccionar de inmediato a las ideas de inferencia de IA. Esto es crucial para sectores como la salud, el transporte y la fabricación, donde los milisegundos son importantes.

La ejecución de la inferencia de IA en el borde también aumenta la eficiencia general, mejora la privacidad y la seguridad de los datos, fortalece la confiabilidad, mejora la experiencia del usuario y permite costos predecibles.

Implementación de IA en entornos centralizados y distribuidos
El lugar donde implementa AI depende de dónde se encuentre en el ciclo de aplicación. Existen múltiples consideraciones para determinar el entorno adecuado, incluidos los requisitos de latencia, las ubicaciones principales de los usuarios, dónde se generan los datos y el costo. Elegir un enfoque híbrido de entornos centralizados y distribuidos puede ser la opción lógica. Se trata de poner las cargas de trabajo correctas en los lugares correctos.

Si está entrenando o refinando modelos de IA, normalmente necesitará grupos centralizados de potencia de cómputo sustancial, almacenamiento para volúmenes de datos y avanzado Recursos de enfriamiento de IA. Estos recursos centralizados podrían estar en la nube, en las instalaciones o en centros de datos de colocación.

Las empresas pueden utilizar un entorno distribuido con clústeres más pequeños para ejecutar los modelos e inferir los datos. Estos entornos se pueden encontrar en el borde, donde puede tener altas concentraciones de usuarios y dispositivos. El edge se puede ubicar en cualquier lugar.

Si bien es cierto que el entrenamiento del modelo de IA ha ocurrido tradicionalmente en entornos centralizados, esto está comenzando a cambiar. Las empresas ven cada vez más el valor de los modelos de formación en más lugares. Los datos recopilados en el borde se pueden usar para volver a entrenar modelos de IA localmente, creando un ciclo de retroalimentación constante a lo largo del tiempo.

El lugar donde entrena modelos de IA debe depender de sus requisitos. Si tiene problemas de privacidad de datos, como el uso de datos propietarios para entrenar sus modelos de IA, un centro de datos local o un centro de datos de colocación de alto rendimiento puede proporcionar las capacidades de control y seguridad que necesita para abordar estas preocupaciones. Es posible que pueda encontrar el hardware de CPU y GPU que necesita en los centros de datos de colocación en sus ubicaciones de borde preferidas. Obtendrá lo mejor de ambos mundos en estos entornos; puede entrenar modelos de IA y ejecutar inferencia en una sola ubicación.

¿Cómo mejora la computación perimetral la inferencia distribuida de IA?
La integración de la informática de borde en su estrategia de infraestructura de TI le permite alejarse de la TI local centralizada. En su lugar, puede colocar cargas de trabajo como la inferencia de IA donde más las necesita. Distribuir la inferencia de IA a través de centros de datos de borde proporciona beneficios que los entornos de cómputo centralizados pueden:

Baja latencia: Procesar datos más cerca de usuarios y dispositivos es esencial para casos de uso con estrictos requisitos de latencia, como vehículos autónomos o robótica industrial. Otras aplicaciones y servicios sensibles a la latencia, como asistentes de voz, mantenimiento predictivo y monitoreo ambiental, también pueden beneficiarse del procesamiento de datos localizado.

Reducido backhaul de datos: Ejecutar la inferencia de IA en el borde reduce la cantidad de datos que se transfieren a entornos de cómputo centralizados. Las empresas solo necesitan transferir los datos relevantes y los resultados en lugar de los conjuntos de datos sin procesar completos. Esto ayuda a mejorar la eficiencia del ancho de banda y a mantener los costos de red predecibles.

Privacidad y seguridad mejoradas: Almacenar y procesar datos confidenciales en el borde minimiza la necesidad de transmitirlos a la nube u otras ubicaciones a través de Internet. Esto es especialmente crucial para el cumplimiento de la privacidad de los datos en los sectores de servicios financieros y atención médica. En otras industrias como la fabricación, ejecutar la inferencia de IA en sistemas de borde permite a las empresas operar con sistemas cerrados y, por lo tanto, evitar conectarse a Internet. Cuando es necesario, distribuyen modelos de capacitación a través de redes privadas.

Fiabilidad mejorada: Operar sistemas y dispositivos de IA de borde de forma independiente, sin conectividad a Internet a la nube y sistemas centralizados, es crucial para industrias como la salud, la fabricación y el transporte. En estos sectores, el tiempo de inactividad puede ser altamente perturbador, incluso potencialmente mortal. Las aplicaciones y los dispositivos deben continuar analizando los datos, identificando ineficiencias y realizando ajustes automáticos en tiempo real, incluso si hay una interrupción en la conectividad de la red. La implementación en el borde lo hace posible.

Consolidación de recursos: Para los minoristas o restaurantes que operan múltiples tiendas dentro de la misma ciudad, puede tener sentido consolidar sus recursos informáticos en una sola ubicación conocida como el borde del metro. Desde el borde del metro, pueden garantizar la conectividad a dispositivos finales con menos de 10 milisegundos (ms) de latencia. Adoptar este enfoque ayuda a las empresas a cumplir con los requisitos locales de soberanía de datos y reducir los costos.

Casos de uso de inferencia de IA y computación de borde
Las empresas en múltiples industrias están utilizando la computación de borde para la inferencia de IA para avanzar en sus agendas de IA. Aquí se explica cómo dos compañías lograron resultados significativos con sus implementaciones de inferencia de IA en el borde:

Empresa de viajes compartidos PickMe quería mejorar la seguridad y mejorar la eficiencia operativa. Integraron IA en su aplicación para permitir la detección de fraude en tiempo real. Luego, PickMe aprovechó la interconexión de alto ancho de banda y baja latencia Plataforma Equinix® para conectarse con su plataforma MLOps y crear múltiples ubicaciones de borde de inferencia de IA que son menos de 10 ms RTT de los usuarios finales. Utilizaron estos datos para producir mapas de calor de la oferta y la demanda, lo que les ayudó a emparejar a los pasajeros con los conductores de manera más eficiente.
Empresa de tecnología sanitaria Harrison.ai quería desarrollar herramientas personalizadas habilitadas para IA para ayudar a los médicos a realizar diagnósticos más rápidos y precisos al analizar radiografías de tórax y escáneres cerebrales. Implementaron sistemas NVIDIA DGX A100 en Platform Equinix para análisis de datos, computación científica y desarrollo de IA. Harrison.ai redujo el tiempo de entrenamiento del modelo y aceleró el proceso de desarrollo de ML mientras protegía los datos confidenciales del paciente.
Implemente la inferencia de IA en el borde con Equinix
Elegir el socio adecuado para este próximo paso en su viaje de IA es crucial. Un proveedor de centros de datos de colocación con una huella global puede ayudarlo a implementar entornos de cómputo centralizados y distribuidos donde los necesite.

La plataforma Equinix incluye un red global de centros de datos en 73 mercados clave en 34 países. Además de proporcionar colocación tradicional, ofrecemos la flexibilidad de la infraestructura digital, soluciones de conectividad privada y rampas de acceso a la nube a todos los principales proveedores.

Equinix Fabric®nuestra solución de interconexión definida por software proporciona conectividad segura, privada y de alto rendimiento para transferencias de datos a través de empresas, nubes, redes y servicios de TI sin atravesar Internet.

Nuestro robusto ecosistema de más de 10,000 empresas incluye proveedores líderes en la nube, proveedores de redes y servicios de TI, y empresas de IA, todas interconectadas para una integración perfecta con su empresa.

Para obtener más información sobre cómo nuestro cliente, PickMe, utilizó la inferencia de IA en el borde, lea su historia de éxito hoy. EQUINIX News. D. A. y R. S. Traducido al español

Artículos relacionados

Scroll al inicio