El Portal de las Tecnologías para la Innovación

Chubut Digital

La IA agente tiene un problema de datos no estructurados: IBM presenta una solución

Esta semana, en Think, IBM está simplificando radicalmente la pila de datos para IA. IBM está mostrando una vista previa de la importante evolución de watsonx.data , que puede ayudar a las organizaciones a preparar sus datos para la IA y proporcionar una base de datos híbrida y abierta, así como una gestión de datos estructurados y no estructurados lista para la empresa. ¿El resultado? Una IA con un 40 % más de precisión que la RAG convencional, según pruebas realizadas con IBM watsonx.data. 1  Entre los productos y funciones que se espera que se lancen en junio se incluyen: La integración de Watsonx.data y la inteligencia de Watsonx.data estarán disponibles como productos independientes, y algunas capacidades también estarán disponibles a través de Watsonx.data, maximizando la elección y la modularidad del cliente. Para complementar estos productos, IBM anunció recientemente su intención de adquirir DataStax, empresa líder en el aprovechamiento de datos no estructurados para la IA generativa. Con DataStax, los clientes pueden acceder a funciones adicionales de búsqueda vectorial. Basado en pruebas internas que comparan la exactitud de las respuestas de los resultados del modelo de IA utilizando la capa de recuperación watsonx.data Premium Edition con RAG solo vectorial en tres casos de uso comunes con conjuntos de datos propietarios de IBM, utilizando el mismo conjunto de modelos de inferencia, evaluación e incrustación de código abierto seleccionados y variables adicionales. Los resultados pueden variar. El contexto de esta importante evolución Las empresas se enfrentan a un importante obstáculo para una IA generativa precisa y eficaz, especialmente la IA agencial. Pero este obstáculo no es lo que la mayoría de los líderes empresariales creen. El problema no son los costos de inferencia ni el difícil de alcanzar, sino los datos. Las organizaciones necesitan datos confiables y específicos de cada empresa para que la IA con agentes realmente genere valor: los datos no estructurados de correos electrónicos, documentos, presentaciones y videos. Se estima  que en 2022, el 90 % de los datos generados por las empresas eran no estructurados, pero IBM proyecta que solo el 1 % se contabiliza en los LLM. Los datos no estructurados pueden ser extremadamente difíciles de aprovechar. Están altamente distribuidos y son dinámicos, se encuentran en diversos formatos, carecen de etiquetas claras y, a menudo, requieren contexto adicional para su interpretación completa. La Recuperación-Generación Aumentada (RAG) convencional no es eficaz para extraer su valor y no puede combinar adecuadamente los datos estructurados y no estructurados. Mientras tanto, una variedad de herramientas desconectadas puede hacer que la pila de datos para IA sea compleja y engorrosa. Las empresas hacen malabarismos con almacenes de datos, lagos de datos y herramientas de gobernanza e integración de datos. La pila de datos puede resultar tan desorientadora como los datos no estructurados que se supone que debe gestionar. Muchas organizaciones no están abordando el problema de raíz. Se centran únicamente en la capa de aplicación de IA generativa, en lugar de la capa de datos esencial subyacente. Hasta que las organizaciones arreglen su infraestructura de datos, los agentes de IA y otras iniciativas de IA generativa no alcanzarán su máximo potencial. Ayudando a las organizaciones a preparar sus datos para la IA Las nuevas capacidades de IBM permitirán a las organizaciones ingerir, gobernar y recuperar datos no estructurados (y estructurados) y, a partir de allí, escalar una IA generativa precisa y de alto rendimiento. IBM Blog. E. C. Traducido al español

La IA agente tiene un problema de datos no estructurados: IBM presenta una solución Leer más »

Un paso hacia la comprensión de la inteligencia de las máquinas a la manera humana

Investigadores de la EPFL han descubierto unidades clave en grandes modelos de IA que parecen ser importantes para el lenguaje, reflejando el sistema lingüístico del cerebro. Al desactivar estas unidades específicas, los modelos empeoraron considerablemente en las tareas lingüísticas. Los modelos de lenguaje grande (LLM) no solo son buenos para comprender y usar el lenguaje, también pueden razonar o pensar lógicamente, resolver problemas y algunos incluso pueden predecir los pensamientos, creencias o emociones de las personas con las que interactúan. A pesar de estos impresionantes logros, aún no comprendemos del todo el funcionamiento interno de los LLM, en particular cómo las distintas unidades o módulos realizan distintas tareas. Por ello, investigadores del Laboratorio de NeuroAI, perteneciente a la Facultad de Ciencias de la Computación y la Comunicación (IC) y a la Facultad de Ciencias de la Vida (SV), y del Laboratorio de Procesamiento del Lenguaje Natural (IC), se propusieron averiguar si los LLM cuentan con unidades o módulos especializados que realizan tareas específicas. Esto se inspira en redes descubiertas en el cerebro humano, como la Red del Lenguaje , la Red de Demanda Múltiple y la red de la Teoría de la Mente . En un artículo presentado este mes en la Conferencia Anual 2025 del Capítulo de las Naciones de las Américas de la Asociación de Lingüística Computacional ,En Albuquerque, Estados Unidos, los investigadores explican cómo investigaron 18 LLM populares y descubrieron que ciertas unidades, de hecho, parecen formar una red central centrada en el lenguaje. Inspirándonos en enfoques neurocientíficos que han mapeado la organización funcional de nuestro cerebro, comparamos la actividad de una unidad al leer oraciones reales con la de listas de palabras aleatorias. Las unidades que reaccionaron más activamente a oraciones reales se identificaron como «unidades selectivas del lenguaje», al igual que la Red Lingüística de nuestro cerebro, explicó el profesor adjunto Martin Schrimpf, director del Laboratorio de NeuroAI. Menos de 100 neuronas extremadamente relevantes Para comprobar la función causal de las unidades selectivas del idioma identificadas, los investigadores las eliminaron y, por separado, eliminaron diferentes conjuntos de unidades aleatorias. A continuación, compararon las diferencias en lo que ocurrió a continuación. Al eliminar las unidades específicas del idioma, pero no las aleatorias, los modelos dejaron de generar texto coherente y no obtuvieron buenos resultados en los parámetros lingüísticos. Los resultados muestran que estas unidades son realmente importantes para el modelo. La principal sorpresa para nosotros fue que probablemente hay menos de 100 neuronas (aproximadamente el 1 % de las unidades) que parecen ser extremadamente relevantes para cualquier aspecto relacionado con la capacidad del modelo para producir y comprender el lenguaje, y que, al interrumpirlas, el modelo falla por completo de repente —explicó Badr AlKhamisi, asistente de doctorado en los laboratorios de NeuroAI y PNL y autor principal del artículo—. Existen investigaciones sobre aprendizaje automático e interpretabilidad que han identificado algunas redes o unidades en un modelo relevantes para el lenguaje, pero requirió mucho entrenamiento y fue mucho más complejo que simplemente usar el mismo localizador empleado en neurociencia humana. Realmente no esperábamos que esto funcionara tan bien —continuó—. Además de las unidades selectivas del lenguaje, esto planteó una pregunta natural: ¿podrían aplicarse también a los LLM los mismos localizadores diseñados para identificar otras redes cerebrales, como la Teoría de la Mente o las redes de demanda múltiple? Utilizando estos localizadores, los investigadores de la EPFL intentaron evaluar si otras unidades dentro de los modelos se especializaban en razonamiento o pensamiento social y descubrieron que algunos modelos poseían estas unidades de tareas específicas mientras que otros no. Más preguntas En algunos modelos encontramos unidades de razonamiento y pensamiento especializadas, y en otros no. Una pregunta interesante ahora mismo es: ¿de dónde proviene esto? ¿Por qué algunos modelos tienen esta preferencia? ¿Se relaciona esto con su rendimiento en indicadores relacionados? Si existen unidades algo aisladas, ¿permite esto que el modelo tenga un mejor rendimiento? Quizás esto se relacione con la forma en que se entrenan los modelos o con los datos con los que se entrenan, y esta es una línea de investigación adicional —dijo Schrimpf—. Otras investigaciones futuras se centrarán en intentar descubrir qué sucede en los modelos multimodelo: modelos que no solo se entrenan con texto sino que también pueden procesar otras modalidades de información, incluidas imágenes, vídeo y sonido. Estoy muy interesado en esto, ya que los humanos operamos con información del habla y la visión. La pregunta es: si usamos un modelo multimodal y le damos, por ejemplo, el lenguaje como información visual, de forma similar a la lectura de un texto, ¿presentará los mismos déficits lingüísticos que al eliminar la Red Lingüística en los LLM, en comparación con una tarea visual donde tiene que identificar varios objetos o realizar razonamiento matemático? ¿Se mantendrán intactos?, preguntó AlKhamissi. En términos más generales, los investigadores creen que estos estudios ayudan a resolver el enigma del funcionamiento interno de los grandes modelos de lenguaje, relacionándolos con la neurociencia y estableciendo conexiones con el funcionamiento del cerebro humano. Si consideramos el daño que sufre la Red del Lenguaje en el cerebro de las personas que han sufrido un ictus, a menudo presentan graves deficiencias del lenguaje, mientras que todo lo demás permanece intacto. Es muy similar en este caso, con el componente del lenguaje LLM, que simplemente produce un galimatías, y aunque no lo hemos probado, probablemente podría funcionar bien en todo lo demás. Esperamos que estos modelos nos ayuden a comprendernos mejor a nosotros mismos y a nuestro cerebro, allanando el camino para un diagnóstico y tratamiento de enfermedades más avanzados», concluyó Schrimpf. El Laboratorio NeuroAI es parte del Instituto Neuro-X de la EPFL , una comunidad colaborativa e interdisciplinaria que reúne a equipos de la Escuela de Ciencias de la Computación y la Comunicación de la EPFL, la Escuela de Ciencias Vivas y la Escuela de Ingeniería . EPFL News. T. P. Traducido al español

Un paso hacia la comprensión de la inteligencia de las máquinas a la manera humana Leer más »

¿Qué es la generación aumentada por recuperación (RAG) y dónde debería realizarse?

Las empresas necesitan ayuda para que los LLM accedan a sus datos privados, y RAG se la proporciona. Llevamos años escuchando que «los datos son el nuevo petróleo». Se ha convertido prácticamente en un cliché. Pero incluso el petróleo necesita refinarse y transportarse antes de poder usarse como combustible. Entonces, ¿qué se necesita para convertir los datos en combustible que genere valor empresarial? Los nuevos modelos de lenguaje de gran tamaño (LLM) prometen redefinir por completo la forma en que las empresas extraen valor de sus datos. Estos LLM se entrenaron con conjuntos de datos mucho mayores que los que las organizaciones habrían podido gestionar anteriormente; por lo tanto, contienen una gama de información mucho más amplia que los modelos anteriores. Si bien el potencial de los LLM es innegable, aún queda la pequeña cuestión de cómo aplicarlos a casos prácticos empresariales reales, y esto suele ser más fácil de decir que de hacer. Los LLM se centran en comprender una base de conocimientos general para simular la forma en que se comunican los humanos. Dado que se centran en el conocimiento general, el conocimiento específico, como las perspectivas y el contexto necesarios para los casos de uso de la IA empresarial, a menudo se pasa por alto. Además, se entrenan con conjuntos de datos estáticos, lo que significa que solo son precisos hasta cierto punto. Los LLM no pueden acceder a datos en tiempo real, al menos no sin ayuda. Aquí es donde entra en juego la generación aumentada por recuperación (RAG). RAG es una técnica para optimizar la inferencia de IA y ayudar a los LLM a generar resultados más precisos. Los sistemas RAG sirven como puente que conecta dos tipos de datos diferentes para optimizar el valor de ambos: La IA empresarial se basa en RAG Como su nombre indica, un sistema RAG amplía los modelos recuperando la información relevante necesaria para generar una respuesta precisa a una solicitud. En lugar de reentrenar un modelo, RAG ayuda a orientarlo hacia datos importantes que no se incluyeron en el conjunto de datos de entrenamiento original, ya sea porque son privados o porque aún no existían. Los sistemas RAG pueden usar API o consultas de datos en vivo para obtener información en tiempo real (o casi en tiempo real) relevante para una solicitud específica. En esencia, cada vez que un usuario final formula una pregunta al modelo, RAG proporciona las pistas y los datos de apoyo que el modelo necesita para obtener una respuesta precisa. RAG puede desempeñar un papel clave en la estrategia de IA privada de una empresa , ya que permite la inferencia segura de conjuntos de datos propietarios que se ejecutan en computación habilitada para GPU bajo el control de la empresa. Esto aumenta la precisión de la información que proporcionan los LLM, sin poner en riesgo la exposición no autorizada de datos internos confidenciales. RAG es un ejemplo de cómo las empresas pueden personalizar y desarrollar los modelos preentrenados que adquieren de los mercados de modelos de IA . Otro método es el ajuste fino, que consiste básicamente en realizar un entrenamiento adicional de los modelos utilizando datos privados. Si bien el ajuste fino es ciertamente útil, también puede ser complejo y consumir muchos recursos, por lo que podría no ser práctico en todos los casos. Además, si los datos están sujetos a una política de retención, integrarlos en un LLM mediante el ajuste fino podría ser problemático. Las empresas también pueden utilizar flujos de trabajo de IA con agentes que extraen datos en tiempo real de diversas fuentes, lo que ayuda a los LLM a tomar decisiones informadas y ejecutar acciones automáticamente. La IA con agentes sin duda representará un gran avance en el desarrollo de la IA empresarial, pero existen cuestiones que deben abordarse primero. Por ejemplo, los líderes empresariales deben garantizar que los agentes de IA que operan sin supervisión humana puedan cumplir con los requisitos de privacidad y soberanía de los datos. Además, la IA con agentes requiere un flujo constante de datos precisos, oportunos y relevantes. Esto significa que la aparición de la IA con agentes en la empresa resaltará aún más la importancia de la RAG. RAG se convertirá inevitablemente en la base de la mayoría de las estrategias de IA empresarial, junto con la IA con agentes. Un flujo de datos compatible con RAG es uno de los requisitos más importantes que una empresa debe cumplir para el éxito de la IA, ya que los datos deben pasar por un sólido conjunto de procesos para garantizar su precisión, relevancia y formato adecuado antes de ser tokenizados e integrados en las bases de datos de RAG. ¿Cómo encaja RAG en el futuro de la IA empresarial? En un enfoque ideal de IA empresarial, un empleado podría hacer una pregunta directa sobre cualquier aspecto del negocio y obtener la mejor respuesta —extraída de todos los datos corporativos, estáticos o en streaming— a la que tiene derecho según los permisos otorgados y otros controles de gobernanza. Por ejemplo, un vendedor debería poder solicitar un resumen de su cuenta más importante y obtener rápidamente una visión precisa y completa de todas las oportunidades e información valiosa para ese cliente, capturadas globalmente en todos los sistemas y almacenes de datos posibles, pero no para otras cuentas que no gestiona. Para lograr este resultado, la infraestructura de RAG debería consultar toda la base de conocimientos de la organización en todas sus aplicaciones, incluyendo conjuntos de datos estáticos y dinámicos. Posteriormente, debería aplicar proactivamente controles de privacidad y soberanía de datos. Esto significa que debería filtrar en tiempo real cualquier información a la que un empleado en particular no tenga derecho, según su puesto y ubicación. La mayoría de las herramientas necesarias para hacer realidad este sueño ya existen, pero el éxito dependerá de una arquitectura flexible e interconectada, ubicada dentro de una plataforma de infraestructura que optimice la opcionalidad, el rendimiento, el coste y la proximidad a todos los puntos del ecosistema de TI empresarial. A medida que las empresas avanzan hacia ese ambicioso futuro de la IA,

¿Qué es la generación aumentada por recuperación (RAG) y dónde debería realizarse? Leer más »

Disfruta de una lista de reproducción épica con pistas de la serie Legend of Zelda.

Aquí tienes una lista de reproducción para tu próxima aventura. Embárcate en un viaje musical con la lista de reproducción The Legend of Zelda Series Selects, que incluye un repertorio de ritmos de la saga Legend of Zelda™. Puedes escucharla en Nintendo Music , una app exclusiva para dispositivos inteligentes para miembros de Nintendo Switch Online que te permite escuchar o descargar música de videojuegos como esta, Super Mario™, Animal Crossing™ y muchos más. La lista de reproducción incluye un popurrí de música de varios juegos de todas las generaciones, junto con algunas melodías retro de dos bandas sonoras recién añadidas: las versiones de The Legend of Zelda para NES™ y Famicom Disk System. ¡Escucha tus canciones favoritas o descubre algo nuevo! Sintoniza con Nintendo Switch Online ¿Listo para relajarte con Nintendo Music? Los miembros de Nintendo Switch Online pueden empezar a escucharla hoy mismo sin coste adicional. Si aún no eres miembro, puedes probarla primero con una prueba gratuita de 7 días . Durante el periodo de prueba, podrás usar la app y disfrutar de la música de tus videojuegos. Nintendo News. Traducido al español

Disfruta de una lista de reproducción épica con pistas de la serie Legend of Zelda. Leer más »

Qualcomm AI Inference Suite: Getting Started is Easy

Developing solutions with AI inference at scale doesn’t have to be hard. Get started today using the Qualcomm AI Inference Suite, hosted on Cirrascale using our Python SDK. Qualcomm has partnered with Cirrascale to provide a free-to-try AI inference service that makes it easy for developers to connect and run inference workloads from code. You don’t need to spin up containers or fiddle with complex cloud infrastructure. All you need to get started is to sign up and obtain an API key. Once you have a key, it is simply a matter of choosing how to connect to the inference endpoint.  If you are most comfortable with Python, an SDK is provided along with documentation so that you can connect using familiar Python coding conventions. Many other programming languages and tools (20+) are supported if you prefer to use OpenAI compliant APIs. Sample scenario Let’s create a sample scenario to showcase use.  You want AI to tell you if a given customer review is positive, negative, or neutral. Once you have that data, you could later analyze which products or services are liked and which are not. Python SDK example Going step by step, we’ll build up our sample code. Import functions you’ll need from the Imagine SDK: Set your API key and endpoint in env variables or in code: Create your client for the API using the endpoint and key: Set up your request, choosing which LLM to use: Call the chat function with your request: Print out the result: Try changing the text of the feedback variable to different sets of text about any product and give it a try. Try it out As you can see, the process of using inference on a scalable platform like the Qualcomm AI Inference Suite is as easy as using any other simple API, but it provides access to very fast results using even larger models.  Even though this is just a small example, it could be integrated into a microservice to provide lots of customer sentiment analysis as part of a production data pipeline. Like what you are seeing? Connect with fellow developers, get the latest news and prompt technical support by joining our Developer Discord. Qualcomm Blog. R. S.

Qualcomm AI Inference Suite: Getting Started is Easy Leer más »

Qualcomm AI Inference Suite: Comenzar es fácil

Desarrollar soluciones con inferencia de IA a escala no tiene por qué ser difícil. Empieza hoy mismo a usar Qualcomm AI Inference Suite, alojada en Cirrascale con nuestro SDK de Python. Qualcomm se ha asociado con Cirrascale para ofrecer un servicio de inferencia de IA de prueba gratuita que facilita a los desarrolladores la conexión y la ejecución de cargas de trabajo de inferencia desde el código. No es necesario crear contenedores ni manipular infraestructuras complejas en la nube. Para empezar, solo hay que registrarse y obtener una clave API. Una vez que tenga una clave, solo tiene que elegir cómo conectarse al punto final de inferencia. Si se siente cómodo con Python, se proporciona un SDK junto con la documentación para que pueda conectarse utilizando las convenciones de codificación de Python habituales. Se admiten muchos otros lenguajes de programación y herramientas (más de 20) si prefiere usar API compatibles con OpenAI . Escenario de muestra Creemos un ejemplo para ilustrar su uso. Quieres que la IA te indique si la reseña de un cliente es positiva, negativa o neutral. Una vez que tengas esos datos, podrás analizar qué productos o servicios son atractivos y cuáles no. Ejemplo de SDK de Python Yendo paso a paso, construiremos nuestro código de muestra. Funciones de importación que necesitarás del SDK de Imagine: Establezca su clave API y punto final en variables de entorno o en el código: Crea tu cliente para la API usando el punto final y la clave: Configura tu solicitud, eligiendo qué LLM utilizar: Llama a la función de chat con tu solicitud: Imprima el resultado: Intente cambiar el texto de la variable de comentarios a diferentes conjuntos de texto sobre cualquier producto y pruébelo. Pruébalo Como puede ver, usar la inferencia en una plataforma escalable como Qualcomm AI Inference Suite es tan sencillo como usar cualquier otra API simple, pero permite acceder a resultados muy rápidos con modelos aún más grandes. Aunque este es solo un pequeño ejemplo, podría integrarse en un microservicio para proporcionar un amplio análisis de la opinión del cliente como parte de un flujo de datos de producción. ¿Te gusta lo que ves? Conéctate con otros desarrolladores, entérate de las últimas noticias y recibe asistencia técnica inmediata uniéndote a nuestro  Discord para desarrolladores . AINubeAprendizaje automático

Qualcomm AI Inference Suite: Comenzar es fácil Leer más »

Liberando el poder de la IA en Dell Technologies World 2025

En Dell Technologies World 2025, nos complace reunir a expertos, innovadores y visionarios de diversos sectores para profundizar en el potencial transformador de la inteligencia artificial.  Exploraremos cómo la IA está revolucionando la forma en que las empresas operan, las industrias evolucionan y las sociedades progresan. Dell Technologies siempre ha estado a la vanguardia de la innovación, impulsando el cambio con tecnologías de vanguardia y soluciones vanguardistas. Creemos que la IA es la clave para abrir un sinfín de posibilidades a organizaciones de todos los tamaños, permitiéndoles mantenerse competitivas en un mundo en constante evolución. Desde la mejora de la experiencia del cliente con soluciones personalizadas hasta la optimización de las operaciones y el aumento de la productividad, la IA está transformando el panorama de lo posible. Los asistentes a Dell Technologies World tendrán la oportunidad de descubrir aplicaciones prácticas de la IA, participar en sesiones interactivas y aprender de los líderes del sector que están forjando el futuro. Ya sea explorando avances en aprendizaje automático o entendiendo cómo la IA puede impulsar las iniciativas de sostenibilidad, Dell Technologies World 2025 promete inspirar y empoderar a las organizaciones para afrontar el futuro con confianza.  Usa los ID de las sesiones para añadir sesiones de interés a tu agenda personalizada. Consulta nuestra guía completa de sesiones y grupos de trabajo . No pierdas la oportunidad de formar parte de este increíble viaje. Regístrate hoy mismo en Dell Technologies World 2025. Implemente cargas de trabajo de IA a la velocidad de la luz con Dell AI Factory En un panorama de IA en rápida evolución, las organizaciones se enfrentan a presiones de comercialización, ineficiencias de costos, falta de habilidades y una imprevisibilidad en el escalamiento. Dell está redefiniendo la infraestructura para simplificar la implementación de cargas de trabajo de IA en Dell AI Factory mediante la automatización, la optimización de las operaciones, la orquestación de la nube híbrida y la seguridad de confianza cero. Esta sesión ofrece una descripción general del nuevo plan de Dell para la flexibilidad de la infraestructura y comparte las mejores prácticas para implementar y administrar sus cargas de trabajo de IA.ID de sesión: 7023P-1 Unificadas, personalizadas y seguras: Soluciones de IA de Dell con Mistral AI Descubra cómo Dell y Mistral ayudan a las organizaciones a crear soluciones de gestión del conocimiento personalizables localmente, manteniendo la privacidad y seguridad de sus datos. Nuestros expertos explicarán cómo los modelos personalizables de vanguardia y las herramientas de IA de Mistral pueden implementarse con Dell AI Factory e integrarse con los datos empresariales para ofrecer inteligencia en tiempo real, razonamiento avanzado y automatización de tareas fluida para una amplia gama de casos de uso.ID de sesión: BT-111 Optimización de la inferencia de IA en el borde con Dell NativeEdge Descubra cómo optimizar la inferencia de IA en el edge transforma las operaciones. Utilice Dell NativeEdge para automatizar la implementación de soluciones de IA en todo su entorno edge, garantizando una gestión optimizada y una mayor seguridad. Explore el aprendizaje continuo mediante la implementación automatizada de los marcos de IA de NVIDIA e Intel con NativeEdge. Vea cómo NVIDIA Metropolis, Riva, NIM, Intel Geti y OpenVINO se optimizan con NativeEdge Blueprints para flujos de trabajo de IA más rápidos y seguros. Potencie su negocio con soluciones innovadoras que simplifican el escalado y elevan la productividad, proporcionando información basada en IA con mayor rapidez y seguridad que nunca.ID de sesión: 5003P-1 Perspectivas de los clientes sobre Dell NativeEdge: Aceleración de la innovación en IA en el borde Descubra cómo Dell NativeEdge, una plataforma escalable de virtualización en el borde, está transformando las industrias. Escuche directamente a un panel diverso de clientes de NativeEdge hablar sobre los desafíos que han enfrentado, por qué eligieron NativeEdge y los resultados que están logrando. Esta sesión, centrada en el cliente, explora cómo la IA en el borde está impulsando la eficiencia, la innovación y el éxito en todas las industrias, compartiendo valiosas lecciones y mejores prácticas.ID de sesión: 5004P-1 IA segura: combine gobernanza, gestión de datos y seguridad para tener éxito La seguridad, la gobernanza y la calidad de los datos son clave para una estrategia de IA eficaz. Únase a nosotros para conocer los marcos de gobernanza cruciales para la integridad y el cumplimiento normativo de los datos, con pasos para un enfoque integrado de la seguridad y la gestión de datos. Aprenda las mejores prácticas de clasificación de datos, visibilidad de la seguridad, controles de acceso y más para proteger el uso de la IA y mejorar el rendimiento de los modelos y la resiliencia de las soluciones. Descubra estas capacidades esenciales a través de una sesión interactiva que destaca los esfuerzos interdisciplinarios necesarios para impulsar objetivos comunes.ID de sesión: 9002P-1, 9002P-2 Transformar los datos en un catalizador para el crecimiento de la IA Descubra cómo las estrategias de datos inteligentes de Dell están dando forma al futuro de GenAI. Esta sesión explora los avances en herramientas como asistentes digitales y búsqueda empresarial, impulsados ​​por una gestión, automatización e integración de datos eficaces. Aprenda pasos claros y prácticos para mejorar la calidad de la IA y escalar con confianza las soluciones empresariales. Concluya con la información necesaria para que sus iniciativas de IA sean impactantes y exitosas.ID de sesión: 9001P-1 Mover datos a la velocidad de la luz: Diseño de redes para impulsar la innovación en IA La creación de redes de IA conlleva desafíos como la gestión de la latencia, la optimización de las estructuras y la escalabilidad. Las soluciones avanzadas utilizan tecnologías como InfiniBand, NVLink y Ethernet compatible con RDMA. Nuestros servicios de diseño de redes de IA están aquí para optimizar el rendimiento del clúster de GPU, permitir un crecimiento escalable y acelerar la innovación en IA para su negocio.ID de sesión: 9005P-1 La oportunidad de las PC con IA: Microsoft Copilot y el futuro de la informática en el lugar de trabajo Descubra cómo los dispositivos con tecnología NPU, las soluciones de IA de Microsoft y los servicios de Dell impulsan la productividad y la

Liberando el poder de la IA en Dell Technologies World 2025 Leer más »

Intel logra la primera y única compatibilidad total con NPU en el benchmark MLPerf Client v0.6

Los resultados muestran que los procesadores Intel Core Ultra Serie 2 ofrecen un rendimiento de procesamiento de IA sin precedentes que abarca la CPU, la GPU y la NPU. Intel anunció hoy que es la única compañía que logra compatibilidad total con la unidad de procesamiento neuronal (NPU) en el nuevo benchmark MLPerf Client v0.6. Este resultado marca la primera evaluación estandarizada de la industria del rendimiento del modelo de lenguaje grande (LLM) en NPU de cliente. Las mediciones de Intel de MLPerf Client v0.6 muestran que los procesadores Intel® Core™ Ultra Serie 2 pueden generar resultados tanto en la unidad de procesamiento gráfico (GPU) como en la NPU a una velocidad mucho mayor que la que un humano promedio puede leer. Nos enorgullece liderar la industria al permitir la aceleración total de NPU y un rendimiento de GPU líder en la industria para cargas de trabajo de IA en plataformas de PC cliente. Este éxito refleja la profunda optimización conjunta de hardware y software de Intel y su compromiso con la democratización de la IA para PC en todo el mundo.–Daniel Rogers, vicepresidente y director general de Marketing de Productos de PC de Intel Por qué es importante: Con sus procesadores Intel Core Ultra Serie 2, Intel está a la vanguardia de la evolución de las PC con inteligencia artificial y ofrece un rendimiento informático de inteligencia artificial sin precedentes que abarca la unidad central de procesamiento (CPU), la GPU y la NPU. MLPerf Client v0.6 mide cuatro casos de uso de generación y resumen de contenido basados ​​en el modelo Llama 2 7B. Intel demostró un rendimiento líder en NPU y GPU Intel® Arc™ integrada. Intel logró el tiempo de respuesta de NPU más rápido, generando la primera palabra en tan solo 1,09 segundos (latencia del primer token), lo que significa que comienza a responder casi inmediatamente después de recibir una solicitud. También logró el mayor rendimiento de NPU con 18,55 tokens por segundo, lo que se refiere a la rapidez con la que el sistema puede generar cada fragmento de texto adicional, lo que permite una interacción fluida con la IA en tiempo real. Además, en comparación con la competencia, Intel demostró liderazgo en GPU en cuanto al tiempo hasta el primer token, comenzando más rápido que la competencia y reforzando su ventaja en la aceleración integral de la IA en NPU y GPU. Acerca de la evaluación comparativa de NPU en MLPerf: desarrollado en colaboración por miembros del consorcio MLCommons (incluidos Intel, AMD, Microsoft, Nvidia y Qualcomm), MLPerf Client v0.6 se extiende más allá de las pruebas anteriores centradas en la GPU para incluir ahora una evaluación comparativa de NPU dedicada. Impulsados ​​por la estrecha colaboración entre los equipos de hardware NPU de Intel y de software OpenVINO™, los procesadores Intel Core Ultra siguen siendo los únicos NPU que logran una conformidad total con NPU en la prueba de referencia final. Más: Dossier de prensa: Procesadores Intel Core Ultra (Serie 2) Nota del editor: Los resultados de la GPU y el número de modelo de la CPU se actualizaron después de la publicación original el 5 de mayo de 2025. La letra pequeña: Configuración de prueba AMD Intel Plataforma OEM ASUS Zenbook S 16 ASUS Zenbook S 14 Número de modelo OEM UM5606WA UX5406SA Modelo de CPU AMD Ryzen AI HX 370 Procesador Intel® Core™ Ultra 9 288V Fecha del BIOS 21 de marzo de 2025 26 de febrero de 2025 Versión del BIOS UM5606WA.317 UX5406SA.306 Memoria total LPDDR5 de 32 GB, 7500 MHz LPDDR5 de 32 GB, 8533 MHz Marca gráfica AMD Radeon 890M Intel Arc 140V Memoria de almacenamiento 1 TB 1 TB Sistema operativo Windows 11 Pro x64 Windows 11 Pro x64 Fuente de energía C.A. C.A. Plan de energía Equilibrado Equilibrado Modo de energía Mejor rendimiento Mejor rendimiento Configuración de potencia OEM myASUS: Velocidad máxima myASUS: Velocidad máxima * Todos los datos medidos al 28 de abril de 2025. Consulte el kit de prensa para obtener detalles sobre la carga de trabajo y la configuración. Avisos y exenciones de responsabilidad El rendimiento varía según el uso, la configuración y otros factores. Obtenga más información en intel.com/performance index. Los resultados de rendimiento se basan en pruebas realizadas en las fechas indicadas en las configuraciones y podrían no reflejar todas las actualizaciones disponibles públicamente. Consulte la copia de seguridad para obtener detalles de la configuración. Ningún producto o componente ofrece una seguridad absoluta. Sus costos y resultados pueden variar. Intel News. Traducido al español

Intel logra la primera y única compatibilidad total con NPU en el benchmark MLPerf Client v0.6 Leer más »

Potenciación de aplicaciones multiagente con el protocolo abierto Agent2Agent (A2A)

Durante el último año, hemos visto cómo los agentes de IA han evolucionado desde herramientas experimentales hasta componentes esenciales de los sistemas empresariales.  Desde simples bots de aviso y respuesta hasta agentes que actúan de forma autónoma en su nombre, este cambio marca una nueva era en el diseño de software donde la inteligencia ya no está ligada a interfaces estáticas ni a aplicaciones individuales. En Microsoft, hemos presenciado esta transformación de primera mano. Azure AI Foundry ya es utilizado por desarrolladores de más de 70.000 empresas y compañías nativas digitales, como Atomicwork, Epic, Fujitsu, Gainsight, H&R Block y LG Electronics, para diseñar, personalizar y administrar aplicaciones y agentes de IA. En tan solo cuatro meses, más de 10.000 organizaciones han adoptado nuestro nuevo Servicio de Agentes para crear, implementar y escalar sistemas de agentes. Más de 230.000 organizaciones, incluido el 90 % de las empresas de la lista Fortune 500, ya utilizan Microsoft Copilot Studio .  A medida que los agentes asumen roles más sofisticados, necesitan acceso no solo a diversos modelos y herramientas, sino también entre sí. Por eso, nos comprometemos a impulsar protocolos abiertos como Agent2Agent (A2A) , que próximamente estarán disponibles en Azure AI Foundry y Copilot Studio, y que permitirán a los agentes colaborar entre nubes, plataformas y organizaciones. Nos alineamos con el impulso general de la industria hacia los protocolos de agentes compartidos, haciendo lo que siempre hemos hecho: adoptar la apertura, apoyar a los desarrolladores del mundo real y convertir la experimentación en plataformas de nivel empresarial. Nuestro objetivo es simple: capacitar tanto a desarrolladores profesionales como ciudadanos para crear agentes que interoperan entre nubes y marcos de trabajo.   Creemos que Microsoft Copilot empoderará a cada empleado y actuará como la interfaz de usuario para la IA, que le permitirá conectarse con agentes y sistemas agénticos: redes de agentes que razonan, actúan y se adaptan a través de las fronteras. A medida que los clientes escalan estos sistemas, la interoperabilidad deja de ser opcional . Quieren que sus agentes organicen tareas que abarcan proveedores, nubes y silos de datos. Quieren control, visibilidad y confianza, sin estar limitados.   A2A permite la comunicación estructurada entre agentes: intercambia objetivos, gestiona estados, invoca acciones y devuelve resultados de forma segura y observable. Los desarrolladores pueden usar herramientas que conocen, como Semantic Kernel o LangChain, y seguir interoperando. Cada llamada pasa por medidas de seguridad de nivel empresarial: Microsoft Entra, TLS mutuo, Azure AI Content Safety y registros de auditoría completos. Azure AI Foundry se basa en la confianza de forma predeterminada, y a medida que los ecosistemas de agentes se vuelven más abiertos y distribuidos, la seguridad, el cumplimiento normativo y la responsabilidad siguen siendo prioritarios.   Comience a usar Azure AI Foundry Comience a utilizar Copilot Studio Lo que estamos entregando  Con soporte para A2A:  Este es solo un paso en un camino más largo. Al igual que con innovaciones como Autogen, Semantic Kernel, nuestras contribuciones al Protocolo de Contexto de Modelo (MCP) y nuestro catálogo de modelos abiertos, seguiremos desarrollando la plataforma para que sea compatible con los protocolos, modelos y marcos de trabajo más importantes para desarrolladores y empresas . Consideramos protocolos como A2A y MCP como pasos importantes para hacer realidad nuestra visión del futuro de la agencia.     ¿Qué sigue?  La computación agente no es una moda, sino un cambio fundamental. Transforma la forma en que se crea software, se toman decisiones y se crea valor.  Nos hemos unido al grupo de trabajo de A2A en GitHub para contribuir a la especificación y las herramientas. La versión preliminar pública de A2A en Foundry y Copilot Studio estará disponible próximamente.   Al apoyar A2A y desarrollar nuestra plataforma de orquestación abierta, sentamos las bases para la próxima generación de software: colaborativo, observable y adaptable por diseño. Los mejores agentes no residirán en una sola aplicación o nube; operarán en el flujo de trabajo, abarcando modelos, dominios y ecosistemas. Construimos ese futuro con la apertura como eje central, porque los agentes no deberían ser islas y la inteligencia debería funcionar a través de las fronteras, al igual que el mundo al que sirve.   Empezando  Hemos introducido un nuevo ejemplo en Semantic Kernel (disponible en Python) que demuestra cómo dos agentes locales pueden colaborar mediante el protocolo A2A. En este ejemplo, los agentes trabajan juntos para planificar un itinerario de viaje y gestionar las conversiones de divisas, lo que demuestra una interoperabilidad fluida sin necesidad de código de orquestación personalizado. Recursos  Microsoft Blog. Y. A. Traducido al español

Potenciación de aplicaciones multiagente con el protocolo abierto Agent2Agent (A2A) Leer más »

Scroll al inicio