El Portal de las Tecnologías para la Innovación

Chubut Digital

Qualcomm e IBM Scale Enterprise-grade Generative AI de Edge a Cloud

Qualcomm e IBM anuncian una colaboración ampliada para impulsar soluciones de IA generativas listas para la empresa en dispositivos de nube y de borde. Destacados: Qualcomm e IBM anuncian una colaboración ampliada para impulsar soluciones de IA generativas listas para la empresa en dispositivos de nube y de borde. planes para integrar IBM watsonx.governance, diseñado para ayudar a las empresas a administrar su IA de manera responsable a escala empresarial, en Qualcomm AI Inference Suite y ejecutarse en dispositivos alimentados por plataformas de alto rendimiento y baja potencia de Qualcomm. los modelos Granite 3.1 de IBM se han optimizado y están disponibles para su descarga a través de Qualcomm AI Hub—, lo que permite a los desarrolladores y empresas aprovechar el potencial de la IA al límite con las plataformas Qualcomm.la familia de aceleradores Qualcomm Cloud AI ha recibido la certificación Red Hat OpenShift, lo que permite verdaderas implementaciones de nube híbrida. 27 De febrero de 2025 SAN DIEGO – 27 de febrero de 2025 – Antes del Mobile World Congress 2025, Qualcomm Technologies, Inc. e IBM (NYSE: IBM) anunció una colaboración ampliada para impulsar soluciones de inteligencia artificial generativa (IA) de nivel empresarial a través de dispositivos de borde y en la nube diseñados para permitir una mayor inmediatez, privacidad, confiabilidad, personalización y menor costo y consumo de energía. A través de esta colaboración, las compañías planean integrar watsonx.governance para soluciones de IA generativas impulsadas por las plataformas Qualcomm Technologies’, y permitir el soporte para los modelos IBM de Granite a través de Qualcomm® AI Inference Suite y Qualcomm® AI Hub. «En Qualcomm Technologies, estamos entusiasmados de unir fuerzas con IBM para ofrecer soluciones de IA generativas de vanguardia y de nivel empresarial para dispositivos a través del borde y la nube, dijo Durga Malladi, vicepresidente senior y gerente general de planificación tecnológica y soluciones de borde de Qualcomm Technologies, Inc. “Esta colaboración permite a las empresas implementar soluciones de IA que no solo son rápidas y personalizadas, sino que también vienen con capacidades sólidas de gobernanza, monitoreo y toma de decisiones, con la capacidad de mejorar la confiabilidad general de la IA desde el borde hasta la nube.» «Profundizar nuestra colaboración con Qualcomm Technologies fortalece nuestra capacidad de llevar la IA generativa de nivel empresarial desde la nube al límite, dijo Ritika Gunnar, Gerente General de Datos e IA de IBM. “Al optimizar los modelos watsonx.governance y Granite de IBM para su uso con las plataformas Snapdragon y Qualcomm Dragonwing, estamos ayudando a las empresas a capitalizar el poder transformador de la IA sin importar dónde residan los datos. Es un gran ejemplo del poder de la asociación.” Las plataformas Qualcomm son compatibles con IBM watsonx.governance y Granite Models Expandiendo sobre sus anuncio en CES, Qualcomm Technologies e IBM planean ejecutar modelos watsonx.governance y Granite Guardian 8B y Granite 3.1 8B en un diseño de referencia Snapdragon® 8 Elite y la Qualcomm Dragonwing™ AI On-Prem Appliance Solution con Qualcomm AI Inference Suite. Estos modelos funcionan en conjunto para proporcionar soluciones de IA generativas de extremo a extremo que se ejecutan en el borde y que contienen barandillas para controlar las implementaciones y operaciones del modelo, monitorear y mejorar la toma de decisiones. A través de esta colaboración, Qualcomm Technologies e IBM están combinando inferencia en el dispositivo, baja potencia y características de privacidad con el rendimiento de watsonx para ayudar a abordar la seguridad, la eficiencia, la confiabilidad y la gobernanza de las soluciones de IA para empresas. Qualcomm AI Hub + IBM Granite Models Qualcomm Technologies ha optimizado IBM Granite 3.1, los modelos de lenguaje insignia Granite de tercera generación de IBM, para Qualcomm AI Hub para ayudar a los desarrolladores y empresas a aprovechar el potencial de la IA en el borde. Las compañías ampliarán la colaboración de Qualcomm AI Hub e IBM watsonx para incluir barandillas de gobernanza y responsabilidad para modelos en el dispositivo a través de las capacidades de gobierno de watsonx. Para obtener más información sobre esta nueva implementación, visita el Blog de desarrolladores de Qualcomm. Qualcomm Cloud AI Accelerators + Red Hat OpenShift La familia de aceleradores Qualcomm® Cloud AI ahora está certificada y disponible para Red Hat OpenShift, la plataforma de aplicaciones de nube híbrida líder en la industria impulsada por Kubernetes. La certificación facilita la implementación a escala del conjunto de aplicaciones de software de IBM, incluido watsonx, utilizando soluciones de hardware basadas en Qualcomm Cloud AI. Para obtener más información sobre las innovaciones y demostraciones de Qualcomm Technologies’ e IBM de AI, visite el stand de Qualcomm Technologies’ en el MWC Barcelona (Booth #3E10, Hall 3, Fira Gran Via). IBM News. Traducido al español

Qualcomm e IBM Scale Enterprise-grade Generative AI de Edge a Cloud Leer más »

Los paneles en la azotea, los cargadores EV y los termostatos inteligentes podrían integrarse para aumentar la resiliencia de la red eléctrica

Los ingenieros del MIT proponen un nuevo “mercado local de electricidad” para aprovechar el potencial de energía de los propietarios’ dispositivos de borde de red. Hay mucho potencial sin explotar en nuestros hogares y vehículos que podrían aprovecharse para reforzar las redes eléctricas locales y hacerlas más resistentes a interrupciones imprevistas, según un nuevo estudio. En respuesta a un ataque cibernético o un desastre natural, una red de respaldo de dispositivos descentralizados — como paneles solares residenciales, baterías, vehículos eléctricos, bombas de calor y calentadores de agua — podría restaurar la electricidad o aliviar el estrés en la red, dicen los ingenieros del MIT. Dichos dispositivos son “recursos de red-edge” que se encuentran cerca del consumidor en lugar de cerca de centrales eléctricas centrales, subestaciones o líneas de transmisión. Los dispositivos de borde de red pueden generar, almacenar o ajustar independientemente su consumo de energía. En su estudio, el equipo de investigación muestra cómo se podría recurrir a tales dispositivos algún día para bombear energía a la red, o reequilibrarla marcando o retrasando su uso de energía. En un papel apareciendo esta semana en el Actas de la Academia Nacional de Ciencias, los ingenieros presentan un plan sobre cómo los dispositivos de borde de red podrían reforzar la red eléctrica a través de una “mercado local de electricidad.” Los propietarios de dispositivos de borde de red podrían suscribirse a un mercado regional y esencialmente prestar su dispositivo para ser parte de una microrred o una red local de recursos energéticos de guardia. En el caso de que la red eléctrica principal se vea comprometida, un algoritmo desarrollado por los investigadores se activaría para cada mercado eléctrico local, para determinar rápidamente qué dispositivos en la red son confiables. El algoritmo identificaría la combinación de dispositivos confiables que mitigarían de manera más efectiva la falla de energía, ya sea bombeando energía a la red o reduciendo la energía que obtienen de ella, en una cantidad que el algoritmo calcularía y comunicaría a los suscriptores relevantes. Los suscriptores podrían ser compensados a través del mercado, dependiendo de su participación. El equipo ilustró este nuevo marco a través de una serie de escenarios de ataque a la red, en los que consideraron fallas en diferentes niveles de una red eléctrica, de diversas fuentes, como un ataque cibernético o un desastre natural. Aplicando su algoritmo, mostraron que varias redes de dispositivos de borde de red pudieron disolver los diversos ataques. Los resultados demuestran que los dispositivos de borde de red, como paneles solares en la azotea, cargadores EV, baterías y termostatos inteligentes (para dispositivos HVAC o bombas de calor) podrían aprovecharse para estabilizar la red eléctrica en caso de un ataque. “Todos estos pequeños dispositivos pueden hacer su poco en términos de ajustar su consumo,” dice el coautor del estudio Anu Annaswamy, científico investigador en el Departamento de Ingeniería Mecánica de MIT. “Si podemos aprovechar nuestros lavavajillas inteligentes, paneles en la azotea y EV, y poner nuestros hombros combinados al volante, realmente podemos tener una cuadrícula resistente Los coautores del MIT incluyen al autor principal Vineet Nair y John Williams, junto con colaboradores de múltiples instituciones, incluido el Instituto Indio de Tecnología, el Laboratorio Nacional de Energía Renovable y otros lugares. Impulso de potencia El estudio de los equipos es una extensión de su trabajo más amplio en la teoría del control adaptativo y el diseño de sistemas para adaptarse automáticamente a las condiciones cambiantes. Annaswamy, quien dirige el Laboratorio de Control Activo-Adaptativo en el MIT, explora formas de aumentar la confiabilidad de las fuentes de energía renovables como la energía solar. “Estas energías renovables vienen con una fuerte firma temporal, ya que sabemos con certeza que el sol se pondrá todos los días, por lo que la energía solar desaparecerá,” dice Annaswamy. “¿Cómo compensas el déficit?” Los investigadores encontraron que la respuesta podría estar en los muchos dispositivos de borde de red que los consumidores están instalando cada vez más en sus propios hogares. “Hay muchos recursos energéticos distribuidos que están surgiendo ahora, más cerca del cliente en lugar de cerca de grandes centrales eléctricas, y es principalmente debido a los esfuerzos individuales para descarbonizar, dice ” Nair. “Así que tienes toda esta capacidad en el borde de la cuadrícula. Seguramente deberíamos poder darles un buen uso.” Al considerar formas de lidiar con las caídas de energía del funcionamiento normal de las fuentes renovables, el equipo también comenzó a analizar otras causas de caídas de energía, como los ataques cibernéticos. Se preguntaron, en estos casos maliciosos, si y cómo los mismos dispositivos de borde de red podrían intervenir para estabilizar la red después de un ataque imprevisto y dirigido. Modo de ataque En su nuevo trabajo, Annaswamy, Nair y sus colegas desarrollaron un marco para incorporar dispositivos de borde de red, y en particular, dispositivos de Internet de las cosas (IoT), de una manera que soportaría la red más grande en caso de un ataque o interrupción. Los dispositivos IoT son objetos físicos que contienen sensores y software que se conectan a Internet. Para su nuevo marco, llamado EUREICA (Efficient, Ultra-REsilient, IoT-Coordinated Assets), los investigadores comienzan con la suposición de que algún día, la mayoría de los dispositivos de borde de red también serán dispositivos IoT, permitiendo que los paneles de techo, cargadores EV y termostatos inteligentes se conecten de forma inalámbrica a una red más grande de dispositivos igualmente independientes y distribuidos.  El equipo prevé que para una región determinada, como una comunidad de 1.000 hogares, existe una cierta cantidad de dispositivos IoT que podrían alistarse en la red local o microrred de la región. Dicha red sería administrada por un operador, que podría comunicarse con los operadores de otras microrredes cercanas. Si la red eléctrica principal se ve comprometida o atacada, los operadores ejecutarían el algoritmo de toma de decisiones de researchers’ para determinar dispositivos confiables dentro de la red que puedan lanzar para ayudar a mitigar el ataque. El equipo probó el algoritmo en varios escenarios, como un ataque cibernético en el

Los paneles en la azotea, los cargadores EV y los termostatos inteligentes podrían integrarse para aumentar la resiliencia de la red eléctrica Leer más »

El modelo de IA descifra el código en proteínas que les dice a dónde ir

Los investigadores del Instituto Whitehead y CSAIL crearon un modelo de aprendizaje automático para predecir y generar la localización de proteínas, con implicaciones para comprender y remediar enfermedades. Las proteínas son los caballos de batalla que mantienen nuestras células funcionando, y hay muchos miles de tipos de proteínas en nuestras células, cada una realizando una función especializada. Los investigadores saben desde hace tiempo que la estructura de una proteína determina lo que puede hacer. Más recientemente, los investigadores están llegando a apreciar que una localización de proteínas también es crítica para su función. Las células están llenas de compartimentos que ayudan a organizar a sus muchos habitantes. Junto con los conocidos orgánulos que adornan las páginas de los libros de texto de biología, estos espacios también incluyen una variedad de compartimentos dinámicos sin membrana que concentran ciertas moléculas para realizar funciones compartidas. Saber dónde se localiza una proteína determinada y con quién se co-localiza, puede ser útil para comprender mejor esa proteína y su papel en la célula sana o enfermapero los investigadores han carecido de una forma sistemática de predecir esta información. Mientras tanto, la estructura de la proteína se ha estudiado durante más de medio siglo, culminando en la herramienta de inteligencia artificial AlphaFold, que puede predecir la estructura de la proteína a partir de un código de aminoácidos de proteínas, la cadena lineal de bloques de construcción dentro de ella que se pliega para crear su estructura. AlphaFold y modelos como este se han convertido en herramientas ampliamente utilizadas en la investigación. Las proteínas también contienen regiones de aminoácidos que no se pliegan en una estructura fija, sino que son importantes para ayudar a las proteínas a unirse a compartimentos dinámicos en la célula. El profesor del MIT Richard Young y sus colegas se preguntaron si el código en esas regiones podría usarse para predecir la localización de proteínas de la misma manera que otras regiones se usan para predecir la estructura. Otros investigadores han descubierto algunas secuencias de proteínas que codifican la localización de proteínas, y algunos han comenzado a desarrollar modelos predictivos para la localización de proteínas. Sin embargo, los investigadores no sabían si una localización de proteínas en cualquier compartimento dinámico podría predecirse en función de su secuencia, ni tenían una herramienta comparable a AlphaFold para predecir la localización.  Ahora, Young, también miembro del Instituto Whitehead para la Investigación Biológica; Henry Kilgore, postdoctorado de laboratorio joven; Regina Barzilay, Profesora Distinguida de la Escuela de Ingeniería para la IA y la Salud en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación del MIT e investigadora principal en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL); y sus colegas han construido un modelo de este tipo, que llaman ProtGPS. En un artículo publicado en 6 De febrero en el diario Cienciacon los primeros autores Kilgore y los estudiantes graduados de laboratorio de Barzilay Itamar Chinn, Peter Mikhael e Ilan Mitnikov, el equipo interdisciplinario estrena su modelo. Los investigadores muestran que ProtGPS puede predecir a cuál de los 12 tipos conocidos de compartimentos se localizará una proteína, así como si una mutación asociada a la enfermedad cambiará esa localización. Además, el equipo de investigación desarrolló un algoritmo generativo que puede diseñar nuevas proteínas para localizar compartimentos específicos. “Mi esperanza es que este sea un primer paso hacia una plataforma poderosa que permita a las personas que estudian proteínas investigar,” Young dice, “y que nos ayude a comprender cómo los humanos se convierten en los organismos complejos que son, cómo las mutaciones interrumpen esos procesos naturales y cómo generar hipótesis terapéuticas y diseñar medicamentos para tratar la disfunción en una célula Los investigadores también validaron muchas de las predicciones de modelos con pruebas experimentales en células. “Realmente me emocionó poder pasar del diseño computacional hasta probar estas cosas en el laboratorio,” dice Barzilay. “Hay muchos documentos interesantes en esta área de la IA, pero el 99.9 por ciento de ellos nunca se prueban en sistemas reales. Gracias a nuestra colaboración con el laboratorio Young, pudimos probar y realmente aprender qué tan bien está nuestro algoritmo.” Desarrollando el modelo Los investigadores entrenaron y probaron ProtGPS en dos lotes de proteínas con localizaciones conocidas. Descubrieron que podía predecir correctamente dónde terminan las proteínas con alta precisión. Los investigadores también probaron qué tan bien podría predecir ProtGPS los cambios en la localización de proteínas en función de las mutaciones asociadas a la enfermedad dentro de una proteína. Se ha encontrado que muchas mutaciones — cambios en la secuencia de un gen y su proteína correspondiente — contribuyen o causan enfermedades según los estudios de asociación, pero las formas en que las mutaciones conducen a los síntomas de la enfermedad siguen siendo desconocidas. Descubrir el mecanismo de cómo una mutación contribuye a la enfermedad es importante porque entonces los investigadores pueden desarrollar terapias para arreglar ese mecanismo, prevenir o tratar la enfermedad. Young y sus colegas sospecharon que muchas mutaciones asociadas a la enfermedad podrían contribuir a la enfermedad al cambiar la localización de proteínas. Por ejemplo, una mutación podría hacer que una proteína no pueda unirse a un compartimento que contenga socios esenciales. Probaron esta hipótesis alimentando a ProtGOS con más de 200,000 proteínas con mutaciones asociadas a enfermedades, y luego pidiéndole que predijera dónde se localizarían esas proteínas mutadas y midiera cuánto cambió su predicción para una proteína dada de la versión normal a la mutada. Un gran cambio en la predicción indica un cambio probable en la localización. Los investigadores encontraron muchos casos en los que una mutación asociada a la enfermedad parecía cambiar la localización de proteínas. Probaron 20 ejemplos en células, usando fluorescencia para comparar dónde en la célula terminó una proteína normal y la versión mutada de la misma. Los experimentos confirmaron las predicciones de ProtGPSs. En conjunto, los hallazgos respaldan la sospecha de los investigadores de que la localización errónea puede ser un mecanismo poco apreciado de la enfermedad, y demuestran el valor de ProtGPS como una herramienta para comprender la

El modelo de IA descifra el código en proteínas que les dice a dónde ir Leer más »

El spinout del MIT mapea los metabolitos del bodyum para descubrir los impulsores ocultos de la enfermedad

ReviveMed utiliza AI para recopilar datos a gran escala sobre metabolitos — moléculas como lípidos, colesterol y azúcar — para que coincida con los pacientes con terapias. La biología nunca es simple. A medida que los investigadores avanzan en la lectura y edición de genes para tratar enfermedades, por ejemplo, un creciente cuerpo de evidencia sugiere que las proteínas y los metabolitos que rodean a esos genes pueden ser ignorados. El spinout del MIT ReviveMed ha creado una plataforma para medir metabolitos — productos del metabolismo como lípidos, colesterol, azúcar y carbohidratos — a escala. La compañía está utilizando esas mediciones para descubrir por qué algunos pacientes responden a los tratamientos cuando otros no lo hacen y para comprender mejor los impulsores de la enfermedad. “Históricamente, weiz ha podido medir unos pocos cientos de metabolitos con alta precisión, pero eso es una fracción de los metabolitos que existen en nuestros cuerpos,” dice ReviveMed CEO Leila Pirhaji PhD ’16, quien fundó la compañía con el profesor Ernest Fraenkel. “Hay una brecha masiva entre lo que weisre mide con precisión y lo que existe en nuestro cuerpo, y eso es lo que queremos abordar. Queremos aprovechar las poderosas ideas de los datos de metabolitos subutilizados.” El progreso de ReviveMedans se produce a medida que la comunidad médica en general vincula cada vez más los metabolitos desregulados con enfermedades como el cáncer, el Alzheimer y las enfermedades cardiovasculares. ReviveMed está utilizando su plataforma para ayudar a algunas de las compañías farmacéuticas más grandes del mundo a encontrar pacientes que se beneficien de sus tratamientos. También ofrece software a investigadores académicos de forma gratuita para ayudar a obtener información de datos de metabolitos sin explotar. “Con el campo de la IA en auge, creemos que podemos superar los problemas de datos que han limitado el estudio de los metabolitos, dice ” Pirhaji. “No hay un modelo básico para la metabolómica, pero vemos cómo estos modelos están cambiando varios campos, como la genómica, por lo que estamos comenzando a ser pioneros en su desarrollo Encontrar un desafío Pirhaji nació y creció en Irán antes de venir al MIT en 2010 para obtener su doctorado en ingeniería biológica. Anteriormente había leído los trabajos de investigación de Fraenkelal y estaba emocionada de contribuir a los modelos de red que estaba construyendo, que integraban datos de fuentes como genomas, proteomas y otras moléculas. “Estábamos pensando en el panorama general en términos de lo que puedes hacer cuando puedes medir todo — los genes, el ARN, las proteínas y las moléculas pequeñas como los metabolitos y los lípidos,” dice Fraenkel, quien actualmente es miembro de la junta directiva de ReviveMedats. “Weirre probablemente solo pueda medir algo así como el 0.1 por ciento de las moléculas pequeñas en el cuerpo. Pensamos que tenía que haber una manera de obtener una visión tan completa de esas moléculas como la que tenemos para las otras. Eso nos permitiría trazar todos los cambios que ocurren en la célula, ya sea en el contexto de cáncer o desarrollo o enfermedades degenerativas Aproximadamente a la mitad de su doctorado, Pirhaji envió algunas muestras a un colaborador de la Universidad de Harvard para recopilar datos sobre el metaboloma — las pequeñas moléculas que son los productos de los procesos metabólicos. El colaborador envió a Pirhaji una enorme hoja de Excel con miles de líneas de datos —, pero le dijeron que era mejor ignorar todo más allá de las 100 filas principales porque no tenían idea de lo que significaban los otros datos. Ella tomó eso como un desafío. “Comencé a pensar que tal vez podríamos usar nuestros modelos de red para resolver este problema,” recuerda Pirhaji. “Había mucha ambigüedad en los datos, y fue muy interesante para mí porque nadie había intentado esto antes. Parecía una gran brecha en el campo.” Pirhaji desarrolló un enorme gráfico de conocimiento que incluía millones de interacciones entre proteínas y metabolitos. Los datos eran ricos pero desordenados — Pirhaji lo llamaba “hair ball” que no podía decirle nada a los investigadores sobre la enfermedad. Para hacerlo más útil, creó una nueva forma de caracterizar las vías y características metabólicas. En un artículo de 2016 en Métodos de Naturalezadescribió el sistema y lo usó para analizar los cambios metabólicos en un modelo de enfermedad de Huntington. Inicialmente, Pirhaji no tenía intención de iniciar una empresa, pero comenzó a darse cuenta del potencial comercial de la tecnología en los últimos años de su doctorado. “No hay cultura empresarial en Irán,” Pirhaji dice. “No sabía cómo iniciar una empresa o convertir la ciencia en una startup, así que aproveché todo lo que MIT ofrecía.” Pirhaji comenzó a tomar clases en la MIT Sloan School of Management, incluido el Curso 15.371 (Equipos de innovación), donde se asoció con sus compañeros de clase para pensar en cómo aplicar su tecnología. También utilizó el MIT Venture Mentoring Service y el MIT Sandbox, y participó en el Martin Trust Center para el acelerador de startups delta v de MIT Entrepreneurshiphops. Cuando Pirhaji y Fraenkel fundaron oficialmente ReviveMed, trabajaron con la Oficina de Licencias de Tecnología de MITic para acceder a las patentes en torno a su trabajo. Desde entonces, Pirhaji ha desarrollado aún más la plataforma para resolver otros problemas que descubrió a partir de conversaciones con cientos de líderes en compañías farmacéuticas. ReviveMed comenzó trabajando con hospitales para descubrir cómo los lípidos están desregulados en una enfermedad conocida como esteatohepatitis asociada a la disfunción metabólica. En 2020, ReviveMed trabajó con Bristol Myers Squibb para predecir cómo responderían los subconjuntos de pacientes con cáncer a las inmunoterapias de la compañía. Desde entonces, ReviveMed ha trabajado con varias compañías, incluidas cuatro de las 10 principales compañías farmacéuticas mundiales, para ayudarlas a comprender los mecanismos metabólicos detrás de sus tratamientos. Esas ideas ayudan a identificar a los pacientes que más se beneficiarán de las diferentes terapias más rápidamente. “Si sabemos qué pacientes se beneficiarán de cada medicamento, realmente disminuiría la complejidad y el tiempo asociados con los ensayos clínicos,

El spinout del MIT mapea los metabolitos del bodyum para descubrir los impulsores ocultos de la enfermedad Leer más »

¿Qué tan disruptivo es DeepSeek? La facultad de Stanford HAI discute el nuevo modelo de los chinos

Los expertos valoran las implicaciones del modelo de código abierto de DeepSeekka y su impacto en la tecnología, la geopolítica, las artes y más. En las últimas semanas, la aparición de DeepSeek de China –, un modelo de lenguaje de código abierto poderoso y rentable –, ha provocado un discurso considerable entre académicos e investigadores de la industria. En el Instituto Stanford para la IA centrada en el ser humano (HAI), los profesores están examinando no solo los avances técnicos de las modelaciones, sino también las implicaciones más amplias para la academia, la industria y la sociedad a nivel mundial. Un elemento central de la conversación es cómo DeepSeek ha desafiado las nociones preconcebidas con respecto al capital y los recursos computacionales necesarios para avances serios en IA. La capacidad de ingeniería inteligente e innovación algorítmica demostrada por DeepSeek puede capacitar a las organizaciones con menos recursos para competir en proyectos significativos. Esta ingeniosa ingeniería, combinada con los pesos de código abierto y un documento técnico detallado, fomenta un entorno de innovación que ha impulsado los avances técnicos durante décadas. Si bien el modelo de peso abierto y el documento técnico detallado son un paso adelante para la comunidad de código abierto, DeepSeek es notablemente opaco en lo que respecta a la protección de la privacidad, el suministro de datos y los derechos de autor, lo que aumenta las preocupaciones sobre el impacto de la IA en las artes, la regulación y la seguridad nacional. El hecho de que DeepSeek fuera lanzado por una organización china enfatiza la necesidad de pensar estratégicamente sobre medidas regulatorias e implicaciones geopolíticas dentro de un ecosistema global de IA donde no todos los actores tienen las mismas normas y donde mecanismos como los controles de exportación no tienen el mismo impacto. DeepSeek ha reavivado las discusiones sobre código abierto, responsabilidad legal, cambios de poder geopolíticos, preocupaciones de privacidad y más. En esta colección de perspectivas, los becarios senior de Stanford HAI ofrecen una discusión multidisciplinaria de lo que DeepSeek significa para el campo de la inteligencia artificial y la sociedad en general. Russ AltmanKenneth Fong Profesor y Profesor de Bioingeniería, de Genética, de Medicina, de Ciencia de Datos Biomédicos, Stanford HAI Senior Fellow, y Profesor, por cortesía, de Ciencias de la Computación En HAI somos académicos, y hay elementos del desarrollo de DeepSeek que proporcionan lecciones y oportunidades importantes para la comunidad académica. En primer lugar, el compromiso con el código abierto (abrazado por Meta y también adoptado por DeepSeek) parece trascender los límites geopolíticos – DeepSeek y Llama (de Meta) brindan una oportunidad para que los académicos inspeccionen, evalúen, evalúen y mejoren los métodos existentes, desde una perspectiva independiente. El movimiento “closed source” ahora tiene algunos desafíos para justificar el enfoque –, por supuesto, sigue habiendo preocupaciones legítimas (por ejemplo, malos actores que usan modelos de código abierto para hacer cosas malas), pero incluso estos son posiblemente mejor combatidos con acceso abierto a las herramientas que estos actores usan para que la gente en la academia, la industria y el gobierno puede colaborar e innovar en formas de mitigar sus riesgos. En segundo lugar, la demostración de que la ingeniería inteligente y la innovación algorítmica pueden reducir los requisitos de capital para los sistemas de IA serios significa que los esfuerzos menos capitalizados en la academia (y en otros lugares) pueden competir y contribuir en algunos tipos de construcción de sistemas. Muchos de nosotros pensamos que tendríamos que esperar hasta la próxima generación de hardware de IA económico para democratizar la IA – este puede ser el caso. Pero incluso antes de eso, tenemos la demostración inesperada de que las innovaciones de software también pueden ser fuentes importantes de eficiencia y costo reducido. En conjunto, ahora podemos imaginar sistemas de IA del mundo real no triviales y relevantes construidos por organizaciones con recursos más modestos. En tercer lugar, el progreso de DeepSeek junto con los avances en los sistemas de IA basados en agentes hace que sea más fácil imaginar la creación generalizada de agentes de IA especializados que se mezclan y combinan para crear sistemas de IA capaces. El monolítico “general AI” todavía puede ser de interés académico, pero será más rentable y mejor ingeniería (por ejemplo, modular) crear sistemas hechos de componentes que se pueden construir, probar, mantener e implementar antes de fusionarse. Un modelo de agentes de IA que cooperan entre sí (y con humanos) replica la idea de “equipos humanos” que resuelven problemas. A veces los problemas son resueltos por un solo genio monolítico, pero esta no suele ser la apuesta correcta. Por lo tanto, DeepSeek ayuda a restablecer el equilibrio al validar el intercambio de ideas de código abierto (los datos son otra cuestión, es cierto), lo que demuestra el poder de la innovación algorítmica continuay permitir la creación económica de agentes de IA que puedan mezclarse y combinarse económicamente para producir sistemas de IA útiles y robustos. Por supuesto, las preguntas permanecen: Choi YejinDieter Schwarz Foundation HAI Professor, Professor of Computer Science, y Stanford HAI Senior Fellow Choi Yejin El éxito del modelo R1 de DeepSeek muestra que cuando hay una “prueba de existencia de una solution” (como lo demuestra OpenAIays o1), se convierte simplemente en cuestión de tiempo antes de que otros encuentren la solución también. La decisión de DeepSeekk de compartir la receta detallada del entrenamiento R1 y los modelos de peso abierto de diferentes tamaños tiene profundas implicaciones, ya que esto probablemente aumentará la velocidad del progreso aún más, estamos a punto de presenciar una proliferación de nuevos esfuerzos de código abierto que replican y mejoran R1. Este cambio indica que la era de la escala de fuerza bruta está llegando a su fin, dando paso a una nueva fase centrada en las innovaciones algorítmicas para continuar escalando a través de la síntesis de datos, nuevos marcos de aprendizaje y nuevos algoritmos de inferencia. Sin embargo, una pregunta importante que enfrentamos en este momento es cómo aprovechar estos poderosos sistemas de inteligencia artificial

¿Qué tan disruptivo es DeepSeek? La facultad de Stanford HAI discute el nuevo modelo de los chinos Leer más »

6 Formas en que la IA está haciendo una diferencia en el mundo

La IA está cambiando el mundo de maneras notables, desde mejorar la atención médica y la educación hasta facilitar la vida de las personas con discapacidades. Está transformando la forma en que las personas viven y trabajan, y su capacidad para analizar grandes cantidades de datos complejos está permitiendo a los científicos estudiar la selva amazónica en Colombia, ayudando a los productores de caña de azúcar a optimizar los cultivos en la India y más.   Aquí hay seis formas en que Microsoft AI está trayendo un cambio positivo en todo el mundo. Ayudar a los proveedores médicos a mejorar la atenciónAyudar a los proveedores médicos aAyudar a los proveedores médicos amejorar la atenciónmejorar la atención Documentar y revisar la información del paciente — notas de la tabla, resultados de pruebas, historial médico — puede llevar mucho tiempo para los proveedores de atención médica. La IA está racionalizando el trabajo para que puedan brindar una mejor atención, pasar más tiempo con los pacientes y reducir el agotamiento.En Taiwán, Chi Mei Medical Center  Asistentes de IA,construido con Azure OpenAI Service, están ayudando a médicos, enfermeras y farmacéuticos a encontrar información, resumir datos y generar informes. En los Estados Unidos, la organización de atención médica de Providence está trabajando con Microsoft en el prototipo  Herramientas de IA para oncólogos analizar los datos de los pacientes de fuentes como texto, imágenes e información genómica con el objetivo de brindar a los pacientes con cáncer tratamientos personalizados y precisos más rápido. Microsoft Investigación y Mayo Clinic también está desarrollando modelos de IA que integran texto e imágenes para explorar cómo la IA puede ayudar a los médicos  analizar los resultados de radiología más rápida y precisa. Documentar y revisar la información del paciente — notas de laDocumentar y revisar la información del paciente — notas de latabla, resultados de pruebas, historial médico — puede llevartabla, resultados de pruebas, historial médico — puede llevarmucho tiempo para los proveedores de atención médica. La IA estámucho tiempo para los proveedores de atención médica. La IA estáracionalizando el trabajo para que puedan brindar una mejorracionalizando el trabajo para que puedan brindar una mejoratención, pasar más tiempo con los pacientes y reducir elatención, pasar más tiempo con los pacientes y reducir elagotamiento.agotamiento. En Taiwán, Chi Mei Medical Center Asistentes de IA, construido conEn Taiwán, Chi Mei Medical Center Asistentes de IA, construido conAzure OpenAI Service, están ayudando a médicos, enfermeras yAzure OpenAI Service, están ayudando a médicos, enfermeras yfarmacéuticos a encontrar información, resumir datos y generarfarmacéuticos a encontrar información, resumir datos y generarinformes. En los Estados Unidos, la organización de atención médicainformes. En los Estados Unidos, la organización de atención médicade Providence está trabajando con Microsoft en el prototipode Providence está trabajando con Microsoft en el prototipoHerramientas de IA para oncólogos analizar los datos de losHerramientas de IA para oncólogos analizar los datos de lospacientes de fuentes como texto, imágenes e informaciónpacientes de fuentes como texto, imágenes e informacióngenómica con el objetivo de brindar a los pacientes con cáncergenómica con el objetivo de brindar a los pacientes con cáncertratamientos personalizados y precisos más rápido.tratamientos personalizados y precisos más rápido. Microsoft Investigación y Mayo Clinic también está desarrollandoMicrosoft Investigación y Mayo Clinic también está desarrollandomodelos de IA que integran texto e imágenes para explorar cómo lamodelos de IA que integran texto e imágenes para explorar cómo laIA puede ayudar a los médicos analizar los resultados de radiologíaIA puede ayudar a los médicos analizar los resultados de radiologíamás rápida y precisa.más rápida y precisa. Transformar el aprendizaje en la escuela y el trabajoTransformar el aprendizaje en la escuelaTransformar el aprendizaje en la escuelay el trabajoy el trabajo La IA tiene el potencial de hacer que la enseñanza, el aprendizaje y la capacitación laboral sean más personalizados y efectivos. Más que  400.000 Profesores en más de 50 países han utilizado un  Impulsado por IA asistente de enseñanza de Khan Academy que ayuda a crear planes de lecciones innovadores — como experimentos de química usando artículos cotidianos, o escribiendo historias basadas en Shakespeare — para hacer que el aprendizaje sea más atractivo y dar a los maestros más tiempo y energía para los estudiantes.A muchas escuelas les gustan  De Wereldreiziger en Bélgica están utilizando aplicaciones impulsadas por IA como Microsoft Microsoft  Progreso de Lectura para ayudar a los estudiantes a practicar su lectura. Las otras herramientas educativas de los compañeros, incluyendo Reading Coach y Search Coach, también son  ayudar a los estudiantes con habilidades importantes.Y Pearson, una organización dedicada a la formación y la educación, está trabajando con Microsoft para  ampliar el aprendizaje personalizado y servicios habilitados para IA para personas de todo el mundo. La IA tiene el potencial de hacer que la enseñanza, el aprendizaje y laLa IA tiene el potencial de hacer que la enseñanza, el aprendizaje y lacapacitación laboral sean más personalizados y efectivos. Más quecapacitación laboral sean más personalizados y efectivos. Más que400.000 Profesores en más de 50 países han utilizado un Impulsado400.000 Profesores en más de 50 países han utilizado un Impulsadopor IA asistente de enseñanza de Khan Academy que ayuda a crearpor IA asistente de enseñanza de Khan Academy que ayuda a crearplanes de lecciones innovadores — como experimentos de químicaplanes de lecciones innovadores — como experimentos de químicausando artículos cotidianos, o escribiendo historias basadas enusando artículos cotidianos, o escribiendo historias basadas enShakespeare — para hacer que el aprendizaje sea más atractivo yShakespeare — para hacer que el aprendizaje sea más atractivo ydar a los maestros más tiempo y energía para los estudiantes.dar a los maestros más tiempo y energía para los estudiantes. A muchas escuelas les gustan De Wereldreiziger en Bélgica estánA muchas escuelas les gustan De Wereldreiziger en Bélgica estánutilizando aplicaciones impulsadas por IA como Microsoftutilizando aplicaciones impulsadas por IA como MicrosoftMicrosoft Progreso de Lectura para ayudar a los estudiantes aMicrosoft Progreso de Lectura para ayudar a los estudiantes apracticar su lectura. Las otras herramientas educativas de lospracticar su lectura. Las otras herramientas educativas de loscompañeros, incluyendo Reading Coach y Search Coach, tambiéncompañeros, incluyendo Reading Coach y Search Coach, tambiénson ayudar a los estudiantes con habilidades importantes.son ayudar a los estudiantes con habilidades importantes. Y Pearson, una organización dedicada a la formación y la educación,Y Pearson, una organización

6 Formas en que la IA está haciendo una diferencia en el mundo Leer más »

Presentamos GPT-4.5

Una vista previa de investigación de nuestro modelo GPT más fuerte. Disponible para usuarios y desarrolladores de Pro en todo el mundo. Weirre lanzó una vista previa de investigación de GPT‑4.5—nuestro modelo más grande y mejor para chatear hasta ahora. GPT‑4.5 es un paso adelante en la ampliación del pre-entrenamiento y post-entrenamiento. Al escalar el aprendizaje no supervisado, GPT‑4.5 mejora su capacidad para reconocer patrones, establecer conexiones y generar ideas creativas sin razonar. Las primeras pruebas muestran que interactuar con GPT‑4.5 se siente más natural. Su base de conocimientos más amplia, su capacidad mejorada para seguir la intención del usuario y su mayor “EQ” lo hacen útil para tareas como mejorar la escritura, la programación y resolver problemas prácticos. También esperamos que alucine menos. Weirre comparte GPT‑4.5 como una vista previa de investigación para comprender mejor sus fortalezas y limitaciones. Weirre todavía está explorando de lo que es capaz y está ansioso por ver cómo la gente lo usa de maneras que quizás no esperábamos. Escalar el aprendizaje no supervisado Avanzamos las capacidades de IA escalando dos paradigmas complementarios: aprendizaje y razonamiento no supervisados. Estos representan dos ejes de inteligencia. GPT‑4.5 es un ejemplo de escalar el aprendizaje no supervisado mediante la ampliación de cómputo y datos, junto con las innovaciones de arquitectura y optimización. GPT‑4.5 fue entrenado en supercomputadoras Microsoft Azure AI. El resultado es un modelo que tiene un conocimiento más amplio y una comprensión más profunda del mundo, lo que lleva a una reducción de las alucinaciones y una mayor fiabilidad en una amplia gama de temas. Escalar el paradigma GPT GPT-4.5 (2025) ¿Cuál fue el primer idioma? No sabemos exactamente cuál fue el primer idioma, y los científicos creen que probablemente nunca lo sabremos con certeza porque los idiomas hablados aparecieron mucho antes de que existieran los registros escritos. Esto es lo que sí sabemos: Hoy en día, los lingüistas estudian los idiomas existentes para comprender cómo evolucionaron durante miles de años, pero la identidad exacta del primer idioma de la humanidad sigue siendo— y probablemente siempre seguirá siendo—, un misterio. Conocimiento mundial más profundo SimpleQA Precisión (más alto es mejor) 62.5%38.2%47%15%0102030405060708090100AccuracyGPT-4.5GPT-4oOpenAI o1OpenAI o3-mini Tasa de Alucinación SimpleQA (más baja es mejor) 37.1%61.8%44%80.3%0102030405060708090100Hallucination rateGPT-4.5GPT-4oOpenAI o1OpenAI o3-mini SimpleQA mide la factualidad LLM (modelo de lenguaje grande) en preguntas de conocimiento directas pero desafiantes. Formación para la colaboración humana A medida que escalamos nuestros modelos y resuelven problemas más complejos, se vuelve cada vez más importante enseñarles una mayor comprensión de las necesidades e intenciones humanas. Para GPT‑4.5, desarrollamos nuevas técnicas escalables que permiten entrenar modelos más grandes y potentes con datos derivados de modelos más pequeños. Estas técnicas mejoran la capacidad de dirección de GPT‑4.5’, la comprensión de los matices y la conversación natural. Evaluaciones comparativas con probadores humanos 56.8%63.2%57.0%CreativeintelligenceProfessionalqueriesEveryday queries0102030405060708090100GPT-4.5 win-rate vs GPT-4o La preferencia humana mide el porcentaje de consultas donde los evaluadores prefirieron GPT‑4.5 sobre GPT‑4o. Combinando una comprensión profunda del mundo con una mejora colaboración da como resultado un modelo que integra ideas de forma natural en conversaciones cálidas e intuitivas que están más en sintonía con la colaboración humana. GPT‑4.5 tiene una mejor comprensión de lo que significan los humanos e interpreta señales sutiles o expectativas implícitas con mayor matiz y “EQ”. GPT‑4.5 también muestra una intuición estética y creatividad más fuertes. Se destaca en ayudar con la escritura y el diseño. Casos de uso Ayuda en un momento difícilIdentifica una pinturaExploración espacialAyuda en un momento difícilIdentifica una pinturaExploración espacial GPT-4.5 Estoy pasando por un momento difícil después de fallar una prueba Aw, siento mucho escuchar eso. Fallar en una prueba puede parecer bastante difícil y desalentador, pero recuerde, es solo un momento, no un reflejo de quién es usted o sus capacidades. ¿Quieres hablar de lo que pasó, o solo necesitas una distracción? Estoy aquí de cualquier manera. GPT-4o Estoy pasando por un momento difícil después de fallar una prueba Siento mucho escuchar que estás pasando por un momento difícil. Aquí hay algunas cosas que puede considerar: 1. Reflexionar y Entender: Trate de analizar lo que podría haber salido mal. ¿Fue una falta de preparación, gestión del tiempo durante la prueba, o tal vez malinterpretar el material? Comprender la causa raíz puede ayudarlo a abordarla en el futuro. 2. Buscar Apoyo: Hable con alguien en quien confíe, amigos, familiares o un consejero escolar. Pueden ofrecer una perspectiva diferente y, a veces, solo hablar de tus sentimientos puede ser aliviado. 3. Habla con tu Maestro o Profesor: Pueden proporcionar información sobre dónde podría haber salido mal y ofrecer consejos sobre cómo mejorar. También pueden ofrecer oportunidades para el trabajo de maquillaje o crédito adicional. 4. Desarrollar un Plan de Estudio: Basado en tus reflexiones, crea un plan para mejorar tus hábitos de estudio. Esto podría incluir establecer tiempos de estudio regulares, descomponer el material en porciones manejables o encontrar nuevos métodos de estudio que funcionen mejor para usted. 5. Mantente Positivo y Perdónate a Ti mismo: Los errores y los contratiempos son parte de la vida. Es importante ser amable contigo mismo y reconocer que el fracaso es un trampolín hacia el éxito. 6. Concéntrese en la Imagen más Grande: Recuerde que una prueba es solo una parte de su viaje educativo. Habrá muchas más oportunidades para hacerlo bien. Si necesita más apoyo o recursos, considere comunicarse con los servicios de apoyo educativo en su institución o con los recursos de salud mental si se siente particularmente abrumado. No estás solo en esto, y las cosas pueden mejorar con tiempo y esfuerzo. GPT‑4.5 muestra una mayor “EQ” y sabe cuándo invitar a más conversaciones versus cuándo proporcionar al usuario información extensa. GPT-4.5 ¿Cuál es esa vieja pintura donde las mujeres prendieron fuego a su bote porque están cansadas de moverse? Creo que tiene que ver con Roma Estás pensando en «Las Mujeres Troyanas Fijando Fuego a Su Flota» por el pintor francés Claude Lorrain. La pintura representa a las mujeres troyanas quemando sus propios barcos, agotadas por su largo viaje y poco dispuestas a seguir viajando después de la caída de Troya.

Presentamos GPT-4.5 Leer más »

Intel presenta Soluciones Ethernet de Alto Rendimiento y Eficiencia Energética

Los nuevos productos Ethernet ofrecen un rendimiento superior, eficiencia energética y un costo total reducido de propiedad en centros de datos empresariales, telecomunicaciones, nube y entornos de borde. Qué hay Nuevo: Intel lanzó hoy dos nuevas líneas de productos Ethernet – los Controladores Intel® Ethernet E830 y Adaptadores de Red, y los Controladores Intel® Ethernet E610 y Adaptadores de Red – diseñados para satisfacer las crecientes demandas de aplicaciones empresariales, de telecomunicaciones, de nube, de borde, de computación de alto rendimiento (HPC) e inteligencia artificial (IA). Estas soluciones de próxima generación proporcionan una conectividad robusta y de alto rendimiento al tiempo que mejoran la eficiencia y la seguridad energética y reducen el costo total de propiedad (TCO). “En el mundo interconectado de hoy, la creación de redes es esencial para el éxito de la transformación empresarial y tecnológica. Con el lanzamiento de los productos Intel Ethernet E830 y E610, estamos ayudando a los clientes a satisfacer la creciente demanda de soluciones de alto rendimiento y eficiencia energética que optimizan las infraestructuras de red, reducen los costos operativos y mejoran TCO.” –Bob Ghaffari, vicepresidente de Intel, Network y Edge Group Lo Que Hacen: Al combinar los procesadores Xeon® 6 de vanguardia de Intel con conectividad Ethernet de alto rendimiento, las nuevas soluciones Ethernet de Intel sientan las bases para aplicaciones escalables e intensivas en datos, lo que permite a las empresas acelerar la innovación, reducir costos y obtener una ventaja competitiva. Con los últimos avances en tecnología de nodo de proceso y Ethernet, las familias E830 y E610 ofrecen avances significativos en rendimiento por vatio y seguridad robusta tanto para centros de datos como para entornos de borde. Los controladores Intel Ethernet E830 y los adaptadores de red ofrecen conectividad de red de alto rendimiento y un rendimiento mejorado por vatio para cargas de trabajo exigentes. Se encuentran entre las dos líneas de productos Ethernet que Intel introdujo en febrero de 2025 para satisfacer las crecientes demandas de aplicaciones empresariales, de telecomunicaciones, de nube, de borde, de computación de alto rendimiento y de IA. (Crédito: Intel Corporation) Intel Ethernet E610 Controllers and Network Adapters are designed with the latest advances in 10GBASE-T for optimized network management and control plane operations. They are among two Ethernet product lines Intel introduced in February 2025. With choices of dual port or quad port and up to 10GbE bandwidth, comprehensive security and manageability features and high energy efficiency, Intel Ethernet E610 Network Adapters deliver optimized and scalable network connectivity required for diverse edge workloads. (Credit: Intel Corporation) Intel Ethernet E610 Controllers and Network Adapters are designed with the latest advances in 10GBASE-T for optimized network management and control plane operations. They are among two Ethernet product lines Intel introduced in February 2025. With choices of dual port or quad port and up to 10GbE bandwidth, comprehensive security and manageability features and high energy efficiency, Intel Ethernet E610 Network Adapters deliver optimized and scalable network connectivity required for diverse edge workloads. (Credit: Intel Corporation) Los controladores Intel Ethernet E830 y los adaptadores de red ofrecen conectividad de red de alto rendimiento y un rendimiento mejorado por vatio para cargas de trabajo exigentes. Se encuentran entre las dos líneas de productos Ethernet que Intel introdujo en febrero de 2025 para satisfacer las crecientes demandas de aplicaciones empresariales, de telecomunicaciones, de nube, de borde, de computación de alto rendimiento y de IA. (Crédito: Intel Corporation) (~14 MB) Por Qué Importa: La tecnología Ethernet continúa sirviendo como la piedra angular de las infraestructuras de red modernas. A medida que las aplicaciones de IA, redes de acceso de radio virtual (vRAN), computación en la nube 5G, edge e Internet de las Cosas (IoT) impulsan el crecimiento de las necesidades de datos y conectividad, las soluciones Ethernet de Intel están diseñadas para proporcionar el rendimiento, la escalabilidad y la seguridad esenciales para satisfacer estas necesidades en evolución. Lo Que Ofrecen: Los Controladores Intel Ethernet E830 y Adaptadores de red están optimizados para cargas de trabajo virtualizadas de alta densidad, ofreciendo configuraciones de puertos flexibles, capacidades avanzadas de sincronización de tiempo y características de seguridad superiores. Los Controladores Intel Ethernet E610 y Adaptadores de Red proporcionan una solución ideal para operaciones de plano de control, con características avanzadas de manejabilidad y eficiencia energética excepcional. Familia Intel Ethernet E830: Alto Rendimiento y Conectividad Versátil La familia Intel Ethernet E830 ofrece soluciones de alto rendimiento, seguras y eficientes diseñadas para cargas de trabajo exigentes en entornos empresariales, de nube, de telecomunicaciones y de borde virtualizados. La primera disponibilidad incluye adaptadores PCIe 25GbE de doble puerto y adaptadores compatibles con OCP 3.0, con configuraciones adicionales a finales de este año. Las características clave de la familia E830 incluyen: Familia Intel Ethernet E610: Redes Eficientes, Seguras y Gestionables La familia Intel Ethernet E610 ofrece una combinación convincente de capacidad de administración, eficiencia energética y seguridad para controlar las redes planas. Disponible en una variedad de velocidades y factores de forma, los productos E610 proporcionan: Acerca de Intelians Proven Partner Ecosystem: Como líder mundial en tecnología Ethernet, Intel ha fomentado un amplio ecosistema de socios, incluidos Cisco, Dell Technologies, Hewlett Packard Enterprise y Supermicro. Este ecosistema abierto garantiza que las soluciones Intel Ethernet se implementen en una amplia variedad de aplicaciones, ofreciendo a los clientes una flexibilidad y opciones incomparables en sus implementaciones de redes. Más Contexto: Para obtener más información sobre Intel Ethernet y cómo puede potenciar los negocios, visite el Sitio Intel Ethernet en Intel.com. Para una inmersión más profunda en los temas de conectividad de cómputo abierto, vea las presentaciones de Intel de OCP Summit: Optimización de redes para Tomorrow‚ como Cloud & Enterprise y ¿Puede el Tiempo Preciso Hacer que Gen AI Workload sea Más Eficiente? Aún Más Contexto: Intel presenta Soluciones de Liderazgo de IA y Redes con Procesadores Xeon 6 | Ecosistema Logra Avance de Eficiencia de Energía en Xeon 6 con E-Cores | Procesadores Intel Xeon 6 (Kit de Prensa) La Pequeña Impresión: 1 La comparación se basa en E610-XAT2 vs. X550AT2 El rendimiento varía según el uso, la configuración y otros factores. Obtenga más información

Intel presenta Soluciones Ethernet de Alto Rendimiento y Eficiencia Energética Leer más »

Construyendo un Sistema Simple de Recuperación de Información Multimodal Basado en VLM con NVIDIA NIM

En el mundo actual basado en datos, la capacidad de recuperar información precisa incluso de cantidades modestas de datos es vital para los desarrolladores que buscan soluciones optimizadas y efectivas para implementaciones rápidas, creación de prototipos o experimentación.  Uno de los desafíos clave en la recuperación de información es administrar las diversas modalidades en conjuntos de datos no estructurados, incluidos texto, archivos PDF, imágenes, tablas, audio, video, etc.  Los modelos multimodales de IA abordan este desafío procesando simultáneamente múltiples modalidades de datos, generando una salida cohesiva y completa en diferentes formas. NIM NVIDIA los microservicios simplifican el despliegue seguro y confiable de la IA modelos de fundación para el lenguaje, visión por computadora, habla, biología y más.  Los microservicios NIM se pueden implementar en la infraestructura acelerada por NVIDIA en cualquier lugar y exponer las API estándar de la industria para una rápida integración con aplicaciones y marcos de desarrollo de IA populares, incluidos LangChain y LlamaIndex. Esta publicación te ayuda a comenzar a construir un modelo de lenguaje de visión (VLM) basado, multimodal, sistema de recuperación de información capaz de responder a consultas complejas que involucran texto, imágenes y tablas. Lo guiamos a través de la implementación de una aplicación utilizando LangGraph, el estado del arte llama-3.2-90b-visión-instruct VLM, el optimizado mistral-pequeño-24B-instruct modelo de lenguaje grande (LLM) y NVIDIA NIM para implementación.   Este método de construcción de sistemas simples de recuperación de información ofrece varias ventajas sobre los tradicionales. El último microservicio VLM NIM permite una mejor comprensión contextual mediante el procesamiento de documentos visuales largos y complejos sin sacrificar la coherencia. La integración de Llamadas a herramientas de LangChaina permite al sistema crear herramientas, seleccionar y utilizar dinámicamente herramientas externas y mejorar la precisión de la extracción e interpretación de datos de diversas fuentes.  Este sistema es bueno para aplicaciones empresariales porque genera salidas estructuradas, asegurando consistencia y confiabilidad en las respuestas. Para obtener más información sobre los pasos de implementación de este sistema, consulte el /NVIDIA/GenerativeAIExamples Repo gitHub. Una simple tubería de recuperación multimodal HTML El sistema consta de las siguientes tuberías:  Ambas tuberías integran NVIDIA NIM y LangGraph para procesar y comprender texto, imágenes, visualizaciones complejas y tablas de manera efectiva. Tubería de ingestión y preprocesamiento de datos Esta etapa analiza documentos para procesar texto, imágenes y tablas por separado. Las tablas se convierten primero en imágenes, y las imágenes son procesadas por el punto final de la API de microservicio NIM alojado en NVIDIA para que el VLM llama-3.2-90b-vision-instruct genere texto descriptivo.  A continuación, en el paso de reconstrucción del documento, el texto descriptivo se fusiona con el texto original del documento, luego se resume en un LLM con modelado de contexto largo capacidad. En esta implementación, llama-3.2-90b-vision-instruct también se usa como LLM, aunque también se pueden implementar otros LLM como mistral-small-24b-instruct.  Finalmente, el texto completo, los resúmenes, las imágenes y sus descripciones se almacenan en una base de datos NoSQL, junto con identificadores de documentos únicos. LLM con modelado de contexto largo puede procesar documentos completos sin fragmentación, mejorando la comprensión del documento en una sola pasada y capturando relaciones y matices en tramos más largos de texto, lo que lleva a una recuperación de información más precisa.  Por el contrario, los modelos tradicionales pueden manejar entradas de hasta unos pocos miles de tokens, lo que requiere que los documentos largos se dividan en trozos más pequeños para que quepan dentro de la ventana de contexto de las modelaciones. Este proceso de procesamiento puede alterar la coherencia y el contexto, lo que dificulta la recuperación precisa y la clasificación de la información relevante.  Sin embargo, el modelado de contexto largo presenta desafíos relacionados con la escalabilidad y el costo, que deben tenerse en cuenta al negociar con mayor precisión. tubería QA Todos los resúmenes de documentos y sus identificadores se compilan en un mensaje grande. Cuando se envía una consulta, a LLM con modelado de contexto largo (mistral-small-24b-instruct en este caso) procesa la pregunta, evalúa la relevancia de cada resumen para la consulta y devuelve los identificadores de los documentos más relevantes. A continuación, los documentos más relevantes se introducen en un LLM con un contexto largo (mistral-small-24b-instruct). El modelo genera una respuesta a la consulta basada en el contenido textual. Si el modelo identifica que una imagen puede contener información pertinente basada en su texto descriptivo, se activa un paso adicional: la imagen original y la pregunta de los usuarios se envían al VLM (llama-3.2-90b-vision-instruct), que puede proporcionar una respuesta basada en el contenido visual real.  Finalmente, el sistema combina ideas textuales y visuales para ofrecer una respuesta integral. Las salidas estructuradas aseguran que los datos devueltos por el modelo se ajusten a un formato predefinido, lo que facilita la extracción de información específica y la realización de operaciones posteriores. Por el contrario, las salidas no estructuradas o variables pueden introducir ambigüedades y dificultades para analizar las respuestas de los modelos, lo que dificulta la automatización y la integración con otros sistemas.  La generación de datos estructurados a partir de modelos generalmente requiere instrucciones cuidadosamente diseñadas para guiar al modelo a responder en un formato particular, como JSON. Sin embargo, garantizar una adherencia constante a esta estructura puede ser un desafío debido a la tendencia natural de models’ a generar texto de forma libre.  NVIDIA NIM ahora es compatible de forma nativa capacidades para generar salidas estructuradas. Esto significa que puede confiar en las funcionalidades integradas para asegurarse de que las respuestas de las modelaciones estén formateadas de manera consistente, lo que reduce la necesidad de una ingeniería rápida compleja. Integración de NVIDIA NIM con LangGraph  NVIDIA NIM ofrece una compatibilidad perfecta con marcos populares y los últimos modelos de IA para sus aplicaciones. La implementación de la tubería integra NVIDIA NIM con LangGraph, un marco para construir aplicaciones agentic para determinar el flujo de control, que ha sido ampliamente adoptado por la comunidad de desarrolladores. Para orquestar el flujo de trabajo de esta tubería, el gráfico consta principalmente de dos nodos:  Nodo asistente  El nodo asistente es un agente primario que opera de acuerdo con el flujo de trabajo descrito en la Figura 3. El código

Construyendo un Sistema Simple de Recuperación de Información Multimodal Basado en VLM con NVIDIA NIM Leer más »

Scroll al inicio