Las empresas necesitan ayuda para que los LLM accedan a sus datos privados, y RAG se la proporciona.
Llevamos años escuchando que «los datos son el nuevo petróleo». Se ha convertido prácticamente en un cliché. Pero incluso el petróleo necesita refinarse y transportarse antes de poder usarse como combustible. Entonces, ¿qué se necesita para convertir los datos en combustible que genere valor empresarial?
Los nuevos modelos de lenguaje de gran tamaño (LLM) prometen redefinir por completo la forma en que las empresas extraen valor de sus datos. Estos LLM se entrenaron con conjuntos de datos mucho mayores que los que las organizaciones habrían podido gestionar anteriormente; por lo tanto, contienen una gama de información mucho más amplia que los modelos anteriores. Si bien el potencial de los LLM es innegable, aún queda la pequeña cuestión de cómo aplicarlos a casos prácticos empresariales reales, y esto suele ser más fácil de decir que de hacer.
Los LLM se centran en comprender una base de conocimientos general para simular la forma en que se comunican los humanos. Dado que se centran en el conocimiento general, el conocimiento específico, como las perspectivas y el contexto necesarios para los casos de uso de la IA empresarial, a menudo se pasa por alto. Además, se entrenan con conjuntos de datos estáticos, lo que significa que solo son precisos hasta cierto punto. Los LLM no pueden acceder a datos en tiempo real, al menos no sin ayuda.
Aquí es donde entra en juego la generación aumentada por recuperación (RAG). RAG es una técnica para optimizar la inferencia de IA y ayudar a los LLM a generar resultados más precisos. Los sistemas RAG sirven como puente que conecta dos tipos de datos diferentes para optimizar el valor de ambos:
- Conjuntos de datos públicos de formación LLM
- Conjuntos de datos de empresas privadas
La IA empresarial se basa en RAG
Como su nombre indica, un sistema RAG amplía los modelos recuperando la información relevante necesaria para generar una respuesta precisa a una solicitud. En lugar de reentrenar un modelo, RAG ayuda a orientarlo hacia datos importantes que no se incluyeron en el conjunto de datos de entrenamiento original, ya sea porque son privados o porque aún no existían.
Los sistemas RAG pueden usar API o consultas de datos en vivo para obtener información en tiempo real (o casi en tiempo real) relevante para una solicitud específica. En esencia, cada vez que un usuario final formula una pregunta al modelo, RAG proporciona las pistas y los datos de apoyo que el modelo necesita para obtener una respuesta precisa. RAG puede desempeñar un papel clave en la estrategia de IA privada de una empresa , ya que permite la inferencia segura de conjuntos de datos propietarios que se ejecutan en computación habilitada para GPU bajo el control de la empresa. Esto aumenta la precisión de la información que proporcionan los LLM, sin poner en riesgo la exposición no autorizada de datos internos confidenciales.
RAG es un ejemplo de cómo las empresas pueden personalizar y desarrollar los modelos preentrenados que adquieren de los mercados de modelos de IA . Otro método es el ajuste fino, que consiste básicamente en realizar un entrenamiento adicional de los modelos utilizando datos privados. Si bien el ajuste fino es ciertamente útil, también puede ser complejo y consumir muchos recursos, por lo que podría no ser práctico en todos los casos. Además, si los datos están sujetos a una política de retención, integrarlos en un LLM mediante el ajuste fino podría ser problemático.
Las empresas también pueden utilizar flujos de trabajo de IA con agentes que extraen datos en tiempo real de diversas fuentes, lo que ayuda a los LLM a tomar decisiones informadas y ejecutar acciones automáticamente. La IA con agentes sin duda representará un gran avance en el desarrollo de la IA empresarial, pero existen cuestiones que deben abordarse primero. Por ejemplo, los líderes empresariales deben garantizar que los agentes de IA que operan sin supervisión humana puedan cumplir con los requisitos de privacidad y soberanía de los datos. Además, la IA con agentes requiere un flujo constante de datos precisos, oportunos y relevantes. Esto significa que la aparición de la IA con agentes en la empresa resaltará aún más la importancia de la RAG.
RAG se convertirá inevitablemente en la base de la mayoría de las estrategias de IA empresarial, junto con la IA con agentes. Un flujo de datos compatible con RAG es uno de los requisitos más importantes que una empresa debe cumplir para el éxito de la IA, ya que los datos deben pasar por un sólido conjunto de procesos para garantizar su precisión, relevancia y formato adecuado antes de ser tokenizados e integrados en las bases de datos de RAG.
¿Cómo encaja RAG en el futuro de la IA empresarial?
En un enfoque ideal de IA empresarial, un empleado podría hacer una pregunta directa sobre cualquier aspecto del negocio y obtener la mejor respuesta —extraída de todos los datos corporativos, estáticos o en streaming— a la que tiene derecho según los permisos otorgados y otros controles de gobernanza. Por ejemplo, un vendedor debería poder solicitar un resumen de su cuenta más importante y obtener rápidamente una visión precisa y completa de todas las oportunidades e información valiosa para ese cliente, capturadas globalmente en todos los sistemas y almacenes de datos posibles, pero no para otras cuentas que no gestiona.
Para lograr este resultado, la infraestructura de RAG debería consultar toda la base de conocimientos de la organización en todas sus aplicaciones, incluyendo conjuntos de datos estáticos y dinámicos. Posteriormente, debería aplicar proactivamente controles de privacidad y soberanía de datos. Esto significa que debería filtrar en tiempo real cualquier información a la que un empleado en particular no tenga derecho, según su puesto y ubicación. La mayoría de las herramientas necesarias para hacer realidad este sueño ya existen, pero el éxito dependerá de una arquitectura flexible e interconectada, ubicada dentro de una plataforma de infraestructura que optimice la opcionalidad, el rendimiento, el coste y la proximidad a todos los puntos del ecosistema de TI empresarial.
A medida que las empresas avanzan hacia ese ambicioso futuro de la IA, la infraestructura RAG distribuida seguirá adquiriendo mayor importancia. No sorprende que en los últimos años se hayan lanzado miles de nuevas herramientas y aplicaciones que abarcan diferentes aspectos de la RAG, incluyendo soluciones comerciales y de código abierto. No es descabellado pensar que la infraestructura RAG llegará a ser tan crucial para la empresa como lo son hoy las herramientas ERP y el correo electrónico.
¿Cómo debería ser una plataforma de infraestructura fundamental para RAG?
Hemos establecido por qué las empresas necesitan RAG. Ahora, consideremos cómo y dónde deberían implementarlo. Las empresas necesitarán construir una plataforma de infraestructura fundamental para la inferencia de IA distribuida, lo que impulsará la necesidad de que RAG acceda, tokenice e integre datos de toda la plataforma. Sobre esta plataforma de infraestructura RAG se asentará una robusta plataforma de datos diseñada para la clasificación, la gobernanza, la protección, la seguridad y el rendimiento, a escala y distribuida en toda la empresa.
La plataforma de infraestructura también debe incluir cada una de las siguientes características:
- Conectividad de baja latencia : Los sistemas RAG deben poder acceder a los datos correctos en el momento oportuno. Esto implica que la plataforma de infraestructura debe estar estrechamente conectada con la plataforma de datos. Los sistemas RAG deben poder acceder a los datos empresariales mediante conectividad de baja latencia, independientemente de su ubicación. Esta conectividad debe extenderse desde la nube hasta el borde, y a todos los puntos intermedios.
- Flexibilidad de infraestructura: Un aspecto clave de RAG es que extrae datos de fuentes dinámicas. Por lo tanto, la infraestructura que soporta RAG necesita escalar con agilidad para adaptarse a la naturaleza cambiante de los datos. Para ello, las empresas necesitan aprovechar recursos flexibles como la infraestructura en la nube y las conexiones virtuales.
- Acceso seguro a los datos : Dado que los sistemas RAG suelen trabajar con conjuntos de datos sensibles, es fundamental que las empresas diseñen su plataforma de infraestructura teniendo en cuenta la privacidad y el control de los datos. Estos sistemas deben poder acceder a cualquier dato que necesiten, sin riesgo de que la organización pierda la custodia de dichos datos ni los exponga a usuarios no autorizados. El almacenamiento de datos RAG en equipos de almacenamiento bajo el control de la empresa, en ubicaciones a las que pueda acceder, será una prioridad en el futuro.
Platform Equinix® ofrece todo lo que las empresas necesitan para construir una infraestructura sólida para RAG. Nuestros clientes pueden implementar un entorno de almacenamiento dedicado para sus datos privados, conocido como Núcleo de Datos Autorizado, y rodearlo con toda la infraestructura en la nube y el borde que exige su estrategia de IA. Esto les permite usar sus datos como necesitan, manteniendo siempre el control sobre ellos.

Los clientes también pueden aprovechar nuestro sólido ecosistema de socios, que incluye a los principales proveedores de nube y proveedores de GPU como servicio. Con Equinix Fabric® , pueden crear conexiones escalables con todos los socios de su ecosistema y entre su propia infraestructura en diferentes ubicaciones. Finalmente, pueden implementar en los centros de datos de coubicación Equinix IBX® en 74 áreas metropolitanas de seis continentes para garantizar el alcance global y la proximidad a las fuentes de datos que requiere su estrategia de IA.
Los centros de datos de alto rendimiento de Equinix ayudan a las empresas a preparar sus operaciones para el futuro, ofreciendo todas las capacidades avanzadas que los centros de datos locales tradicionales no ofrecen. La implementación de una infraestructura preparada para la IA es solo un ejemplo de los beneficios que ofrecen los centros de datos de alto rendimiento. Descubra cómo construir su futuro con la infraestructura de datos adecuada: lea la infografía . Equinix Blog. G. D. Traducido al español