El Portal de las Tecnologías para la Innovación

Categoría: Innovaciones Tecnológicas

Presentamos modelos de audio de próxima generación en la API

Un nuevo conjunto de modelos de audio para alimentar a los agentes de voz, ahora disponible para los desarrolladores de todo el mundo. En los últimos meses, weized ha invertido en el avance de la inteligencia, las capacidades y la utilidad de los agentes basados en texto, o sistemas que realizan tareas de forma independiente en nombre de los usuarios, con versiones como Operator, Deep Research, Computer-Using Agents y Responses API con herramientas integradas. Sin embargo, para que los agentes sean realmente útiles, las personas deben poder tener interacciones más profundas e intuitivas con agentes más allá de solo text—usando lenguaje hablado natural para comunicarse de manera efectiva. Hoy, weitare lanza nuevos modelos de audio de voz a texto y de texto a voz en API—, lo que permite construir agentes de voz más potentes, personalizables e inteligentes que ofrezcan un valor real. Nuestros últimos modelos de voz a texto establecen un nuevo punto de referencia de vanguardia, superando las soluciones existentes en precisión y confiabilidad, especialmente en escenarios desafiantes que involucran acentos, entornos ruidosos y velocidades de voz variables. Estas mejoras aumentan la confiabilidad de la transcripción, lo que hace que los modelos sean especialmente adecuados para casos de uso como centros de llamadas de clientes, transcripción de notas de reuniones y más. Por primera vez, los desarrolladores también pueden instruir al modelo de texto a voz para que hable de una manera específica—por ejemplo, “habla como un agente de servicio al cliente simpático”—desbloqueando un nuevo nivel de personalización para los agentes de voz. Esto permite una amplia gama de aplicaciones personalizadas, desde voces de servicio al cliente más empáticas y dinámicas hasta narración expresiva para experiencias creativas de narración. Lanzamos nuestro primer modelo de audio en 2022 y desde entonces, WeiVe se ha comprometido a mejorar la inteligencia, la precisión y la fiabilidad de estos modelos. Con estos nuevos modelos de audio, los desarrolladores pueden construir sistemas de voz a texto más precisos y robustos y voces de texto a voz expresivas y características, todo dentro de la API. Calma Surfer Profesional Caballero medieval Verdadero aficionado al crimen Historia de la hora de dormir Más sobre nuestros últimos modelos de audio Nuevos modelos de voz a texto Weirre presenta nuevo gpt-4o-transcribe y gpt-4o-mini-transcribe modelos con mejoras en la tasa de error de palabras y un mejor reconocimiento y precisión del idioma, en comparación con los modelos Whisper originales. gpt-4o-transcribedemuestra un rendimiento mejorado de la Tasa de Error de Word (WER) sobre los modelos Whisper existentes en múltiples puntos de referencia establecidos, lo que refleja un progreso significativo en nuestra tecnología de voz a texto. Estos avances se derivan directamente de innovaciones específicas en el aprendizaje por refuerzo y una amplia formación intermedia con diversos conjuntos de datos de audio de alta calidad. Como resultado, estos nuevos modelos de voz a texto pueden capturar mejor los matices del habla, reducir los reconocimientos erróneos y aumentar la confiabilidad de la transcripción, especialmente en escenarios desafiantes que involucran acentos, entornos ruidosos y velocidades de voz variables. Estos modelos están disponibles ahora en el API de voz a texto(se abre en una ventana nueva).enesptfrcmndejaidruittrarhikonlplviuksvdanbthromsbnmrtateguurmlknswLanguage00.10.20.30.40.50.60.70.80.911.11.2Word Error Rate (WER) — lower is bettergpt-4o-transcribegpt-4o-mini-transcribewhisper-large-v2whisper-large-v3Reduced Transcription Error in Latest Speech-to-Text Models on FLEURS Word Error Rate (WER) mide la precisión de los modelos de reconocimiento de voz al calcular el porcentaje de palabras transcritas incorrectamente en comparación con una transcripción de referencia, la WER es mejor y significa menos errores. Nuestros últimos modelos de voz a texto logran un WER más bajo en todos los puntos de referencia, incluido FLEURS (Few-shot Learning Evaluation of Universal Representations of Speech)—, un punto de referencia de voz multilingüe que abarca más de 100 idiomas utilizando muestras de audio transcritas manualmente. Estos resultados demuestran una precisión de transcripción más fuerte y una cobertura de lenguaje más robusta. Como se muestra aquí, nuestros modelos superan constantemente a Whisper v2 y Whisper v3 en todas las evaluaciones de idiomas.enesptfrcmndejakoitidrutrarhinlLanguage00.020.040.060.080.10.120.140.160.180.2Word Error Rate (WER) — lower is bettergpt-4o-transcribegpt-4o-mini-transcribegemini-2.0-flashscribe-v1nova-2 & nova-3Word Error Rate Comparison on FLEURS Across Leading Models En FLEURS, nuestros modelos ofrecen un menor WER y un sólido rendimiento multilingüe. Un WER más bajo es mejor y significa menos errores. Como se muestra aquí, nuestros modelos coinciden o superan a otros modelos líderes en la mayoría de los idiomas principales. Nuevo modelo de texto a voz Weiosre también lanza un nuevo gpt-4o-mini-tts modelo con mejor dirigibilidad. Por primera vez, los desarrolladores pueden “instruir” el modelo no solo sobre qué decir, sino también cómo para decirlo, puede habilitar experiencias más personalizadas para casos de uso que van desde el servicio al cliente hasta la narración creativa. El modelo está disponible en el API de texto a voz(se abre en una ventana nueva). Tenga en cuenta que estos modelos de texto a voz se limitan a voces preestablecidas artificiales, que supervisamos para garantizar que coincidan constantemente con los preajustes sintéticos. Innovaciones técnicas detrás de los modelos Preentrenamiento con conjuntos de datos de audio auténticos Nuestros nuevos modelos de audio se basan en las arquitecturas GPT‑4o y GPT‑4o-mini y están ampliamente preentrenados en conjuntos de datos especializados centrados en audio, que han sido críticos para optimizar el rendimiento del modelo. Este enfoque específico proporciona una visión más profunda de los matices del habla y permite un rendimiento excepcional en tareas relacionadas con el audio. Metodologías avanzadas de destilación Hemos mejorado nuestras técnicas de destilación, permitiendo la transferencia de conocimiento de nuestros modelos de audio más grandes a modelos más pequeños y eficientes. Aprovechando metodologías avanzadas de juego automático, nuestros conjuntos de datos de destilación capturan de manera efectiva dinámicas conversacionales realistas, replicando interacciones genuinas de asistente del usuario. Esto ayuda a nuestros modelos más pequeños a ofrecer una excelente calidad de conversación y capacidad de respuesta. Refuerzo del paradigma de aprendizaje Para nuestros modelos de voz a texto, hemos integrado un paradigma de aprendizaje por refuerzo (RL), que lleva la precisión de la transcripción a niveles de vanguardia. Esta metodología mejora drásticamente la precisión y reduce la alucinación, haciendo que nuestras soluciones de voz a texto sean

Leer más »

En una primera para Suiza, EPFL contribuye a la investigación kaon

Los investigadores de EPFL, trabajando con el Centre de Physique des Particules de Marseille, han desarrollado un nuevo método para identificar neutrinos utilizando datos del experimento NA62 del CERN, que recientemente observó la descomposición de partículas más rara jamás registrada. La física de partículas explora los bloques de construcción más pequeños de la naturaleza, partículas tan pequeñas que billones de ellas pasan a través de nosotros sin ser notadas cada segundo. Entre ellos se encuentran los kaons, partículas hechas de un quark y un antiquark. Los kaones son fascinantes porque se someten a “decaimiento, un proceso en el que las partículas inestables se transforman en otras más estables, derramando energía en el proceso. Al estudiar estas desintegraciones, los físicos sondean las fuerzas fundamentales y prueban el Modelo Estándar, el marco que explica cómo interactúan las partículas y las fuerzas. Los kaones son especialmente importantes en “física de sabores,” un campo que estudia cómo los diferentes tipos, o “sabores,” de quarks interactúan y se transforman. Las desintegraciones raras, como un kaon que se transforma en un pión y un par neutrino-antineutrino, revelan detalles intrincados de estas interacciones. Esta descomposición, llamada “canal dorado” de física del sabor, ocurre solo una vez en diez mil millones de kaon decae. Sin embargo, puede revelar información clave sobre la fuerza débil y las simetrías fundamentales de los universales. Hito: observar una rara descomposición kaon Desde 2023, EPFL ha ampliado su experiencia en investigación de física a la investigación con kaons, convirtiéndose en la primera institución suiza en parte del CERNemals Experimento NA62. En septiembre de 2024, NA62 informó de la primera observación de la rara descomposición kaon, transformándose en un pión y un par neutrino-antineutrino. La observación fue el resultado de analizar una gran cantidad de datos experimentales de 2016 a 2022, y tecnología avanzada para aislar la descomposición. Y aunque el resultado se alinea con el Modelo Estándar de la física, la tasa de decaimiento es un 50% más alta de lo previsto, lo que sugiere posibles descubrimientos más allá de la física actual. Radoslav Marchevski, profesor del Laboratorio de Física de Alta Energía de EPFLina desde 2023, y su equipo han contribuido significativamente al análisis de datos que condujo a la observación. “Durante la última década, weiesve contribuyó sustancialmente, desde demostrar la capacidad de NA62’ para medir este proceso y continuar el esfuerzo para mejorar la medición hasta proponer modificaciones de configuración en 2021 que mejoraron la sensibilidad,” dice. Una nueva técnica para el etiquetado de neutrinos Pero la contribución de EPFL no se detuvo allí. Para mejorar las capacidades de detección del experimento NA62, el equipo de Marchevskiys trabajó con el Centre de Physique des Particules de Marseille (CPPM) para ser pioneros en una innovadora técnica de etiquetado de neutrinos “, un método utilizado para identificar neutrinos y vincularlos a los eventos de partículas que los produjeron. ¿Qué son los neutrinos? Son algunas de las partículas más misteriosas, que interactúan tan débilmente que miles de millones pasan a través de la Tierra sin dejar rastro. Vienen en tres “sabores” — electrón, muón y tau — correspondientes al tipo de partícula cargada con la que están asociados durante las interacciones. Identificar el sabor de un neutrino es crucial para estudiar fenómenos como las oscilaciones de neutrinos, donde los neutrinos cambian de sabor a medida que viajan. El nuevo método desarrollado por EPFL y CPPM utiliza desintegraciones kaon para etiquetar el sabor del neutrino evento por evento, lo que nunca se ha hecho antes. Esto es innovador porque une directamente cada neutrino a su partícula madre, lo que permite mediciones de precisión de las propiedades de los neutrinos. “Esta novedosa técnica nos permite etiquetar los sabores de neutrinos a medida que se producen y asociarlos con precisión a las interacciones en el área activa de nuestros detectores, algo que nunca antes se había hecho,” explica Marchevski. “Abre oportunidades únicas para futuros experimentos de física de neutrinos al proporcionar una resolución de energía mucho mejor y un etiquetado de sabor de neutrinos, lo que permitirá estudios de precisión de las propiedades de los neutrinos Ambos descubrimientos son importantes para la física: Observar la rara decadencia kaon apunta a cierta tensión con el Modelo Estándar, y la posibilidad de «nueva física» – fenómenos que van más allá de nuestra comprensión actual del mundo subatómico. Mientras tanto, la técnica de etiquetado de neutrinos podría transformar futuros experimentos, ofreciendo herramientas para sondear las interacciones de neutrinos y su papel fundamental en el cosmos. Marchevski agrega: “Con EPFL ahora parte de NA62, weesove trajo física kaon a Suiza, liderando contribuciones clave, incluida una nueva técnica de etiquetado de neutrinos, y mostrando la creciente visibilidad de EPFL en física de partículas internacional Financiación F.R.S.-FNRS (Fonds de la Recherche Scientifique – FNRS) CECI (Consorcio de Equipos de Cálculo Intensif) NSERC (Consejo de Investigación de Ciencias Naturales e Ingeniería) MEYS (Ministerio de Educación, Juventud y Deportes) BMBF (Bundesministerium für Bildung und Forschung) INFN (Istituto Nazionale di Fisica Nucleare) MIUR (Ministero dellsIstruzione, dellsUniversità e della Ricerca) CONACyT (Consejo Nacional de Ciencia y Tecnología) IFA (Instituto de Física Atómica) MESRS (Ministerio de Educación, Ciencia, Investigación y Deporte) CERN (Organización Europea para la Investigación Nuclear) STFC (Consejo de Instalaciones Científicas y Tecnológicas) NSF (Fundación Nacional de Ciencias) ERC (Consejo Europeo de Investigación) Horizonte 2020 de la UE Universidad Charles Fundación Checa de Ciencia La Royal Society ANR (Agencia Nacional de la Recherche) ANR-19-CE31-0009 Referencias La Colaboración NA62. Observación de la descomposición y medición de la relación de ramificación de K+→. Journal of High Energy Physics 27 de febrero de 2025. DOI: 10.1007/JHEP02(2025)191 La Colaboración NA62. Primera detección de un neutrino marcado en el experimento NA62. Cartas de Física B 863 :139345. DOI: 10.1016/j.physletb.2025.139345 EPFL News. P. N. Traducido al español

Leer más »

Samsung Electronics exhibe Innovaciones de TV con IA en el Seminario Tecnológico Europeo 2025

Los expertos de campo obtienen una vista previa exclusiva de los últimos productos de audio y pantalla de Samsung, con un enfoque en las tecnologías de IA, antes del lanzamiento al mercado Samsung Electronics, el fabricante líder mundial de TV durante 19 años consecutivos, está iniciando los Seminarios Tecnológicos 2025 en Frankfurt, Alemania, desde marzo de 18–19, dando a los profesionales de los medios y la industria un primer vistazo exclusivo a sus innovaciones de TV y audio más avanzadas impulsadas por IA antes de que lleguen al mercado. Ahora en su 14o año, el seminario ofrece a los expertos de campo experiencias prácticas de la última línea de TV de Samsung antes de su lanzamiento oficial. Este año, el seminario mostrará tecnologías relacionadas con la calidad de imagen impulsada por IA, el sonido inmersivo y las experiencias de visualización de próxima generación. Revolucionando la Experiencia de Pantalla con IA Samsung TVs 2025 contará con potentes funciones impulsadas por IA diseñadas para mejorar la experiencia del usuario. En el corazón de esta innovación está Visión AI, una plataforma avanzada que personaliza y simplifica la forma en que los usuarios interactúan con sus pantallas. Características como Haga clic para Buscar permite a los espectadores acceder instantáneamente a información relevante sobre el contenido en pantalla, mientras Traducir en Vivo proporciona traducciones de audio en tiempo real para una visualización global perfecta. Remoto Rápido transforma un teléfono inteligente en un centro de control, ofreciendo una experiencia más intuitiva y conectada. Samsung también ha introducido un sin costuras experiencia multidispositivo, permitiendo el intercambio y control de contenido sin esfuerzo en dispositivos Samsung. Características como Almacenamiento Compartir, lo que permite transferencias de archivos fáciles entre dispositivos Galaxy y TV, y Multi Control, que permite a los usuarios operar múltiples dispositivos Samsung con un solo teclado y mouse, crear un ecosistema más conectado y optimizado. Calidad de imagen OLED y Neo QLED de Próxima Generación Samsung 2025 TV OLED introducir Glare Gratis 2.0, minimizando los reflejos para una experiencia cristalina e inmersiva. Desarrollado por el Procesador NQ4 AI Gen3 y 128 redes neuronales, AI Upscaling agudiza los detalles con notable precisión, mientras HDR OLED la tecnología aumenta el brillo y el contraste. El 2025 Neo QLED 4K características de la alineación atenuación local avanzada para negros más profundos y precisión HDR mejorada. AI Motion Enhancer, anteriormente exclusivo de los modelos 8K, ahora está disponible en televisores 4K, ofreciendo imágenes ultra suaves ideales para deportes y contenido lleno de acción. Expandiendo la Cartera de TV de Estilo de Vida La línea de TV Lifestyle de Samsung sigue empujando los límites del diseño y la innovación, combinando tecnología de vanguardia con estética doméstica personalizada. El Frame Pro redefine tanto el entretenimiento como el hogar, ahora con Mini-LED Atenuación Local para un brillo mejorado y una calidad de imagen realista. Con acceso a más de 3.000 obras de arte digitales a través de Tienda de Arte Samsung, los usuarios pueden transformar instantáneamente su TV en una impresionante galería personal. La adición de Wi-Fi 7 asegura una instalación perfecta, reduciendo el desorden de cables para una configuración más limpia y sofisticada. Mientras tanto, El Premiere 5 ofrece una experiencia de proyección compacta pero potente con interacción táctil, lo que la hace ideal para juegos, educación y entretenimiento doméstico inmersivo. Diseñado para la versatilidad, ofrece imágenes inmersivas en una variedad de entornos, desde aulas hasta teatros en casa y mucho más. Presentamos la Próxima Era del Sonido Inmersivo Samsung está redefiniendo la innovación de audio con Audio Eclipsa, la primera tecnología de sonido IAMF 3D de la industria desarrollada en colaboración con Google. Este avanzado sistema optimiza el sonido espacial mediante el análisis de reflexiones ambientales, ofreciendo una experiencia de sonido envolvente profundamente inmersiva. En el Seminario Tecnológico 2025, los asistentes estarán entre los primeros en experimentar Eclipsa Audio de primera mano y verán su integración perfecta con las últimas barras de sonido de Samsung para una experiencia de cine en casa de próximo nivel. “En Samsung, nos comprometemos a hacer que todos los dispositivos que usas sean más inteligentes y estén más conectados,” dijo Benjamin Braun, Director de Marketing de Samsung Europeans. “Ya sea que esté utilizando Vision AI para optimizar automáticamente la configuración de su TV o los servicios impulsados por IA para simplificar las actividades como la búsqueda o la administración del hogar, estamos mostrando cómo la tecnología puede sentirse más personal y tangible que nunca Después del evento de Frankfurt, Samsung llevará la serie Tech Seminar a regiones clave como el sudeste de Asia y América Latina, brindando a más profesionales de la industria avances prácticos exclusivos de sus innovaciones de audio y pantalla impulsadas por IA antes de su lanzamiento al mercado. ▲ Kevin Cha del Laboratorio de Soluciones de Calidad de Imagen de Samsung explica cómo la tecnología Glare Free 2.0 y la tecnología OLED HDR mejoran la comodidad de visualización. ▲ Haylie Jung de Samsung Picture Quality Solution Lab destaca la atenuación local avanzada y las mejoras impulsadas por IA en el Neo QLED 4K 2025, con el procesador NQ4 AI Gen3. ▲ Steffen Greb de ECSO de Samsung demuestra Vision AI y una conectividad multidispositivo perfecta en todos los productos de Samsung. ▲ Deokhwan Kim de Samsungan Picture Quality Solution Lab demuestra las capacidades táctiles de The Premiere 5’s. ▲ Hyungwoo Kim de Samsungan Sound Device Lab muestra Eclipsa Audio, la tecnología de audio 3D de Samsung, que permite a los usuarios disfrutar de una experiencia de sonido tridimensional inmersiva. Samsung News. Traducido al español

Leer más »

El enfoque de impresión 3D une objetos dinámicos para usted

“El método Xstrings” permite a los usuarios producir objetos accionados por cable, ensamblando automáticamente robots biónicos, esculturas y diseños de moda dinámicos. Es difícil construir dispositivos que repliquen el movimiento fluido y preciso de los humanos, pero eso podría cambiar si pudiéramos tirar de algunas cuerdas (literales). Al menos, eso es la idea detrás de los mecanismos “cable-driven” en los que ejecutar una cadena a través de un objeto genera movimiento aerodinámico a través de diferentes partes de un objeto. Tome un dedo robótico, por ejemplo: Podría incrustar un cable a través de la palma hasta la punta del dedo de este objeto y luego tirarlo para crear un movimiento de rizado. Si bien los mecanismos accionados por cable pueden crear movimiento en tiempo real para hacer que un objeto se doble, tuerza o pliegue, pueden ser complicados y llevar mucho tiempo ensamblarlos a mano. Para automatizar el proceso, los investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT han desarrollado un enfoque de impresión 3D todo en uno llamado “Xstrings.” Herramienta de diseño de piezas, método de fabricación de piezas, Xstrings puede integrar todas las piezas y producir un dispositivo accionado por cable, ahorrando tiempo al ensamblar robots biónicos, crear instalaciones de arte o trabajar en diseños de moda dinámicos. Reproducir videoEl enfoque de impresión 3D une los mecanismos impulsados por cable para ustedVídeo: MIT CSAIL En a papel para ser presentados en la Conferencia de 2025 sobre Factores Humanos en Sistemas de Computación (CHI2025), los investigadores utilizaron Xstrings para imprimir una gama de objetos coloridos y únicos que incluían un robot lagarto rojo, una escultura de pared púrpura que puede abrirse y cerrarse como una cola de pavo real, un tentáculo blanco que se enrosca alrededor de los elementos y una garra blanca que puede reventar en un puño para agarrar objetos. Para fabricar estos mecanismos llamativos, Xstrings permite a los usuarios personalizar completamente sus diseños en un programa de software, enviándolos a una impresora 3D multimaterial para dar vida a esa creación. Puede imprimir automáticamente todas las piezas de dispositivos en sus ubicaciones deseadas en un solo paso, incluidos los cables que lo atraviesan y las juntas que permiten el movimiento previsto. El postdoctorado de MIT CSAIL y autor principal Jiaji Li dice que Xstrings puede ahorrar tiempo y energía a los ingenieros, reduciendo el 40 por ciento del tiempo total de producción en comparación con hacer las cosas manualmente. “Nuestro método innovador puede ayudar a cualquiera a diseñar y fabricar productos impulsados por cable con una impresora 3D bimaterial de escritorio,” dice Li. Un nuevo giro en la fabricación por cable Para usar el programa Xstrings, los usuarios primero introducen un diseño con dimensiones específicas, como un cubo rectangular dividido en piezas más pequeñas con un agujero en el medio de cada una. Luego puede elegir de qué manera se mueven sus partes seleccionando diferentes “primitivas:” doblando, enrollando (como un resorte), girando (como un tornillo) o comprimiendo — y el ángulo de estos movimientos. Para creaciones aún más elaboradas, los usuarios pueden incorporar múltiples primitivas para crear combinaciones intrigantes de movimientos. Si quisieras hacer una serpiente de juguete, podrías incluir varios giros para crear un combo “series”, en el que un solo cable impulsa una secuencia de movimientos. Para crear la garra del robot, el equipo incrustó varios cables en una combinación “parallel”, donde se incrustan varias cuerdas, para permitir que cada dedo se cierre en un puño. Xstrings facilita cómo se integran los cables en el objeto que está produciendo. Los usuarios pueden elegir exactamente cómo se aseguran las cadenas, incluido su punto final, los agujeros dentro de la estructura por la que pasa el cable y dónde tirará para operar el dispositivo.Imagen cortesía de los investigadores. Más allá del ajuste fino de la forma en que se mueven los mecanismos accionados por cable, Xstrings también facilita la forma en que los cables se integran en el objeto. Los usuarios pueden elegir exactamente cómo se aseguran las cadenas, en términos de dónde se encuentran “anchor” (punto final), “áreas roscadas” (o agujeros dentro de la estructura por la que pasa el cable) y “point” expuesto (donde tire de usted para operar el dispositivo). Con un dedo robot, por ejemplo, puede elegir el ancla que se ubicará en la punta del dedo, con un cable que atraviesa el dedo y una etiqueta de extracción expuesta en el otro extremo. Xstrings también admite diversos diseños de juntas colocando automáticamente componentes que son elásticos, compatibles o mecánicos. Esto permite que el cable gire según sea necesario, ya que completa el movimiento previsto del dispositivo. Impulsar diseños únicos en robótica, arte y más allá Una vez que los usuarios han simulado su plan digital para un artículo impulsado por cable, pueden darle vida a través de la fabricación. Xstrings puede enviar su diseño a una impresora 3D de modelado de deposición fusionada, donde el plástico se funde en una boquilla antes de que los filamentos se viertan para construir estructuras capa por capa. Xstrings utiliza esta técnica para diseñar cables horizontalmente y construir a su alrededor. Para garantizar que su método imprimiera con éxito mecanismos impulsados por cable, los investigadores probaron cuidadosamente sus materiales y condiciones de impresión. Por ejemplo, los investigadores encontraron que sus cuerdas solo se rompieron después de ser levantadas y bajadas por un dispositivo mecánico más de 60,000 veces. En otra prueba, el equipo descubrió que imprimir a 260 grados Celsius con una velocidad de 10-20 milímetros por segundo era ideal para producir sus muchos artículos creativos. “El software Xstrings puede dar vida a una variedad de ideas,” dice Li. “Le permite producir un dispositivo robot biónico como una mano humana, imitando nuestras propias capacidades de agarre. También puede crear piezas de arte interactivas, como una escultura por cable con geometrías únicas y ropa con solapas ajustables. Un día, esta tecnología podría permitir la creación rápida y en un solo paso de robots accionados por cable en el espacio exterior, incluso en

Leer más »

Desbloquear el potencial de AII para organizaciones sin fines de lucro con Lenovo y Tech To The Rescue

Los equipos equipan a las organizaciones impulsadas por la misión con las herramientas, la capacitación y la tecnología para impulsar el impacto y la transformación reales. El poder de la IA está dando forma a las industrias, revolucionando los negocios y transformando la forma en que resolvemos desafíos complejos. Pero mientras que las corporaciones y los gobiernos lo son invertir fuertemente en innovación de IA, muchas organizaciones sin fines de lucro corren el riesgo de quedarse atrás sin los recursos, la experiencia o la infraestructura para aprovechar la IA para el impacto. ¿Cómo pueden los líderes tecnológicos apoyar a estas organizaciones? En un podcast reciente de Tech for Good Talks, Alice Damasceno, Directora de Ciudadanía Corporativa y Comunicaciones ESG para Lenovo Latinoamérica, se sentó en São Paulo con Ana Camerano desde Tecnología Para El Rescate (TTTR), una fundación global sin fines de lucro que conecta a organizaciones sin fines de lucro ambiciosas con compañías de tecnología dispuestas a apoyarlas con soluciones pro-bono. Discutieron la visión de Lenovoova para el impacto impulsado por la IA, el enfoque de la ciudadanía corporativa de los compañías y cómo Lenovo AI para Social Impact Lab está dando a las organizaciones sin fines de lucro las herramientas y los recursos que necesitan para integrar la IA. Una asociación que convierte la innovación en acción Lenovo y TTTR comparten una creencia común: La IA debe ser accesible e inclusiva. Es por eso que Lenovo se unió a TTTRals  AI para Changemakers Accelerator, una iniciativa respaldada por otros grandes actores tecnológicos. El acelerador combina organizaciones sin fines de lucro con tecnólogos voluntarios calificados que les ayudan a diseñar e implementar soluciones de IA adaptadas a sus misiones. El Lenovo AI for Social Impact Lab lleva este soporte un paso más allá: equipa a diez organizaciones sin fines de lucro seleccionadas con hardware de Lenovo de vanguardia, herramientas de IA y orientación experta para ayudarlas a convertir sus aspiraciones de IA en un impacto en el mundo real. Para Lenovo, esta colaboración es parte de una visión más amplia para hacer de la IA una fuerza para la inclusión en lugar de un motor de desigualdad. Como explicó Alice Damasceno en el podcast, Lenovo ve su papel en el impacto social no solo como donante sino como un facilitador estratégico, asegurando que la tecnología se desarrolle y despliegue de manera ética y equitativa. Cómo la IA impulsa el cambio social Para Lenovo, la ciudadanía corporativa es más que filantropía—se trata de aprovechar la tecnología para servir a las personas y al planeta. Alice Damasceno explica que el enfoque de Lenovoova se centra en Smarter Technology for All, asegurando que la innovación avance en los negocios al tiempo que aborda los desafíos sociales y ambientales críticos. Durante la conversación, Damasceno compartió ejemplos inspiradores del mundo real de cómo Lenovo está aplicando la IA para resolver problemas apremiantes: Estos ejemplos resaltan un cambio fundamental en la forma en que las corporaciones abordan el impacto social, no solo a través de contribuciones financieras sino también a través de intervenciones estratégicas impulsadas por la tecnología que crean un cambio sostenible. El papel de la ciudadanía corporativa en un mundo cambiante Reflexionando sobre su carrera en el impacto social, Alice Damasceno enfatizó el creciente papel de las empresas de tecnología en la configuración de un futuro más inclusivo y sostenible. La ciudadanía corporativa, explica, no es una ocurrencia tardía, sino una parte integral de cómo Lenovo opera, incorporando los principios de ESG, la diversidad y la inclusión, y la participación de la comunidad en su estrategia comercial central. “Los desafíos de worldians son complejos, pero la tecnología puede ser parte de la solución,” dice Damasceno. “Al involucrar a los empleados, asociarnos con organizaciones sin fines de lucro e invertir en proyectos de impacto impulsados por la IA, estamos creando un modelo donde las empresas pueden prosperar mientras impulsan un cambio significativo El Lenovo AI for Social Impact Lab ayuda a garantizar que la innovación en IA no siga siendo un privilegio de las corporaciones, sino que se convierta en una herramienta para la resolución de problemas globales, disponible para aquellos que más lo necesitan. Mirando hacia el futuro: cómo puede responder la industria tecnológica A medida que la IA y las tecnologías emergentes continúan evolucionando, la colaboración entre corporaciones, organizaciones sin fines de lucro y organizaciones impulsadas por el impacto será fundamental para garantizar que estas innovaciones beneficien a la sociedad. Este es un compromiso a largo plazo para Lenovo—, parte de su estrategia más amplia de Smarter AI for All, asegurando que la innovación de IA sirva a las personas, no solo a las ganancias. Para Tech To The Rescue, esta asociación es un plan de cómo las corporaciones y las organizaciones sin fines de lucro pueden colaborar para hacer de la IA una verdadera herramienta para la transformación social. “Si no hacemos que la IA sea accesible para las organizaciones impulsadas por misiones, corremos el riesgo de profundizar la brecha digital,” dijo Damasceno en el podcast. “Pero cuando le damos a las organizaciones sin fines de lucro las herramientas, el conocimiento y los socios adecuados, pueden resolver problemas de maneras que nunca imaginamos La verdadera pregunta no es si las organizaciones sin fines de lucro deberían usar AI—, la pregunta es si la industria de la tecnología dará un paso adelante para asegurarse de que puedan. Lenovo News. J. E. Traducido al español

Leer más »

Explicando Tokens — el Idioma y la Moneda de la IA

Los tokens son unidades de datos procesados por modelos de IA durante el entrenamiento y la inferencia, lo que permite la predicción, la generación y el razonamiento. Bajo el capó de cada aplicación de IA hay algoritmos que producen datos en su propio idioma, uno basado en un vocabulario de tokens. Los tokens son pequeñas unidades de datos que provienen de descomponer fragmentos más grandes de información. Los modelos de IA procesan tokens para aprender las relaciones entre ellos y desbloquear capacidades que incluyen predicción, generación y razonamiento. Cuanto más rápido se puedan procesar los tokens, más rápidos podrán aprender y responder los modelos. AI fábricas — una nueva clase de centros de datos diseñados para acelerar las cargas de trabajo de IA — crujen eficientemente los tokens, convirtiéndolos del lenguaje de la IA a la moneda de la IA, que es la inteligencia. Con las fábricas de IA, las empresas pueden aprovechar las últimas soluciones informáticas de pila completa para procesar más tokens a un menor costo computacional crear valor adicional para los clientes. En un caso, la integración de las optimizaciones de software y la adopción de las GPU NVIDIA de última generación redujeron el costo por token en 20 veces en comparación con los procesos no optimizados en las GPU de generación anterior — entregando 25 veces más ingresos en solo cuatro semanas. Al procesar eficientemente los tokens, las fábricas de IA están fabricando inteligencia —, el activo más valioso en la nueva revolución industrial impulsada por la IA. ¿Qué es la Tokenización?  Si a transformador modelo AI está procesando texto, imágenes, clips de audio, videos u otra modalidad, traducirá los datos en tokens. Este proceso se conoce como tokenización. La tokenización eficiente ayuda a reducir la cantidad de potencia informática requerida para entrenamiento e inferencia. Existen numerosos métodos de tokenización — y los tokenizadores adaptados para tipos de datos específicos y casos de uso pueden requerir un vocabulario más pequeño, lo que significa que hay menos tokens para procesar. Para grandes modelos de idiomas (LLM), las palabras cortas pueden representarse con un solo token, mientras que las palabras más largas pueden dividirse en dos o más tokens. La palabra oscuridad, por ejemplo, se dividiría en dos fichas, “dark” y “ness,” con cada ficha con una representación numérica, como 217 y 655. La palabra opuesta, brillo, se dividiría de manera similar en “bright” y “ness,” con representaciones numéricas correspondientes de 491 y 655. En este ejemplo, el valor numérico compartido asociado con “ness” puede ayudar al modelo de IA a comprender que las palabras pueden tener algo en común. En otras situaciones, un tokenizador puede asignar diferentes representaciones numéricas para la misma palabra dependiendo de su significado en contexto. Por ejemplo, la palabra “lie” podría referirse a una posición de descanso o a decir algo falso. Durante el entrenamiento, el modelo aprendería la distinción entre estos dos significados y les asignaría diferentes números de token. Para los modelos visuales de IA que procesan imágenes, video o datos de sensores, un tokenizador puede ayudar a mapear entradas visuales como píxeles o vóxeles en una serie de tokens discretos. Los modelos que procesan audio pueden convertir clips cortos en espectrogramas — representaciones visuales de ondas de sonido a lo largo del tiempo que luego se pueden procesar como imágenes. Otras aplicaciones de audio pueden centrarse en capturar el significado de un clip de sonido que contiene voz, y utilizar otro tipo de tokenizador que captura tokens semánticos, que representan datos de lenguaje o contexto en lugar de simplemente información acústica. ¿Cómo se Utilizan los Tokens Durante el Entrenamiento de IA? El entrenamiento de un modelo de IA comienza con la tokenización del conjunto de datos de entrenamiento. Según el tamaño de los datos de entrenamiento, el número de tokens puede sumar miles de millones o billones — y, según el ley de escalamiento previa al entrenamiento, cuantos más tokens se utilicen para el entrenamiento, mejor será la calidad del modelo de IA. Como es un modelo de IA preentrenadose prueba mostrándole un conjunto de muestras de tokens y se le pide que prediga el siguiente token. Según si su predicción es correcta o no, el modelo se actualiza para mejorar su próxima suposición. Este proceso se repite hasta que el modelo aprende de sus errores y alcanza un nivel objetivo de precisión, conocido como convergencia del modelo. Después del entrenamiento previo, los modelos se mejoran aún más post-entrenamiento, donde continúan aprendiendo en un subconjunto de tokens relevantes para el caso de uso donde se implementarán. Estos podrían ser tokens con información específica del dominio para una aplicación en derecho, medicina o negocios — o tokens que ayudan a adaptar el modelo a una tarea específica, como razonamiento, chat o traducción. El objetivo es un modelo que genere los tokens correctos para entregar una respuesta correcta basada en una consulta de usuario —, una habilidad más conocida como inferencia. ¿Cómo se Utilizan los Tokens Durante la Inferencia y el Razonamiento de la IA?  Durante la inferencia, una IA recibe un mensaje — que, dependiendo del modelo, puede ser texto, imagen, clip de audio, video, datos del sensor o incluso secuencia genética — que se traduce en una serie de tokens. El modelo procesa estos tokens de entrada, genera su respuesta como tokens y luego lo traduce al formato esperado de los usuarios. Los idiomas de entrada y salida pueden ser diferentes, como en un modelo que traduce inglés a japonés, o uno que convierte las indicaciones de texto en imágenes. Para comprender un mensaje completo, los modelos de IA deben poder procesar múltiples tokens a la vez. Muchos modelos tienen un límite específico, conocido como ventana de contexto — y diferentes casos de uso requieren diferentes tamaños de ventana de contexto. Un modelo que puede procesar unos pocos miles de tokens a la vez podría procesar una sola imagen de alta resolución o unas pocas páginas de texto. Con una longitud de contexto de decenas de miles de tokens, otro modelo podría resumir una novela completa o un episodio de podcast

Leer más »

Cisco Allana el Camino con la Colaboración Agentic AI

Cisco presenta nuevas soluciones Webex AI que predicen y automatizan las experiencias de los clientes y empleados Resumen de noticias:  ORLANDO, Fla., 17 de marzo de 2025 – En Enterprise Connect, Cisco (NASDAQ: CSCO) develar su visión para la colaboración de IA agentic, junto con nuevas soluciones de colaboración impulsadas por IA diseñadas para crear experiencias a prueba de futuro para clientes, empleados y equipos de TI. Cisco está conduciendo hacia un futuro en el que AI anticipa las necesidades de los clientes y empleados, aborda los desafíos, cumple con la intención y mejora aún más la productividad para todos. Las nuevas innovaciones de IA agentic incluyen la disponibilidad general del agente de IA de Webex para mejorar la experiencia del cliente. Las soluciones adicionales anunciadas a través de Collaboration Devices y Webex Suite incluyen nuevos flujos de trabajo en AI Assistant para Webex Suite para optimizar las experiencias de los empleados, Webex Calling Customer Assist y AirPlay en Cisco Devices para Microsoft Teams Rooms.   “Las empresas están empezando a darse cuenta del potencial de la IA agentica. Está reinventando lo que significa para las personas y la tecnología trabajar juntas en el mundo físico y digital, dijo Jeetu Patel, Vicepresidente Ejecutivo y Director de Producto de Cisco. “A nuestros clientes les encanta cómo Webex AI se integra perfectamente en la forma en que trabajas.  Trabajando junto a los empleados aumentando la eficiencia, mejorando el sentimiento de los empleados y mejorando las experiencias generales de los clientes  Creación de Centros de Experiencia del Cliente con IA   Los centros de contacto tradicionales, principalmente reactivos para abordar las consultas de los clientes, se están convirtiendo en centros de experiencia donde cada interacción es una oportunidad para proporcionar interacciones excepcionales con los clientes. Webex está haciendo esto posible con la cartera de Experiencia del cliente de Webex con herramientas como AI Agent y AI Assistant for Contact Center que responden sin problemas a las preguntas de customers’ y se integran con los sistemas de back-office para el cumplimiento automatizado de intenciones. Las nuevas soluciones de IA incluyen:  Entregando Experiencias de Empleados con IA para Usuarios Finales y TI  En la era digital actual, los empleados esperan experiencias de colaboración inteligentes y eficientes. Las soluciones impulsadas por IA brindan una colaboración fluida y refuerzan la productividad para cada empleado, desde los usuarios finales que dependen de nuestros productos diariamente hasta los profesionales de TI que garantizan operaciones sin problemas. Los empleados pueden usar algunas de estas herramientas a medida que estén disponibles a finales de este año para aumentar su productividad con la automatización del flujo de trabajo que agiliza las tareas rutinarias, personaliza y administra fácilmente las capacidades y conocimientos de IA, y más, que incluyen:   Cualquier empleado puede estar capacitado para ayudar a los clientes con esta solución de llamadas Webex:  El ecosistema Webex ofrece una integración perfecta de innovaciones y herramientas de colaboración impulsadas por IA, mejorando las experiencias de los usuarios con interacciones seguras, flexibles y ricas en todos los espacios de trabajo:  Para ver las innovaciones de Cisco en acción, únase a la nota clave de Enterprise Connect el martes 18 de marzo de 11:30 am – 12:00 pm EST y visite Cisco en el Stand #1607. CISCO News. Traducido al español

Leer más »

Próxima generación Snapdragon G Series Portfolio Uplevels Handheld Gaming Experiencias

Qualcomm Technologies, Inc. anunció hoy su línea 2025 de Snapdragon® G Series Gaming Platforms, diseñada a propósito para alimentar dispositivos de juego portátiles para una amplia gama de jugadores. Destacados: SAN DIEGO – 17 de marzo de 2025 – Qualcomm Technologies, Inc. anunció hoy su línea 2025 de Snapdragon® G Series Gaming Platforms, diseñada a propósito para alimentar dispositivos de juego portátiles para una amplia gama de jugadores. La nueva cartera consta de Snapdragon G3 Gen 3, Snapdragon G2 Gen 2 y Snapdragon G1 Gen 2, creados para ofrecer las mejores experiencias de juego portátiles de su clase. «Las Plataformas de Juego de la Serie G de Snapdragon están redefiniendo los juegos en movimiento con rendimiento avanzado y experiencias inmersivas, dijo Micah Knapp, Director Senior de Gestión de Productos de Qualcomm Technologies, Inc. “Estos procesadores Snapdragon G Series de próxima generación impulsarán el futuro de los juegos portátiles al admitir una amplia gama de tipos de juego y factores de forma para que los fabricantes y desarrolladores innoven en.” Este trimestre, los OEM comenzarán a lanzar dispositivos impulsados por la nueva línea de productos Snapdragon G Series. Obtenga más información sobre todas las Plataformas de Juego de la Serie G de Snapdragon aquí. Qualcomm News. Traducido al español

Leer más »

La luz giratoria y retorcida podría alimentar la electrónica de próxima generación

Los investigadores han avanzado un desafío de décadas en el campo de los semiconductores orgánicos, abriendo nuevas posibilidades para el futuro de la electrónica. Los investigadores, liderados por la Universidad de Cambridge y la Universidad Tecnológica de Eindhoven, han creado un semiconductor orgánico que obliga a los electrones a moverse en un patrón espiral, lo que podría mejorar la eficiencia de las pantallas OLED en pantallas de televisión y teléfonos inteligentes, o impulsar tecnologías informáticas de próxima generación como la espintrónica y la computación cuántica. Es como trabajar con un conjunto de Lego con todo tipo de formas que puedas imaginar, en lugar de solo ladrillos rectangulares. Richard Amigo El semiconductor que desarrollaron emite luz polarizada circularmente, lo que significa que la luz transporta información sobre la — mano‘de electrones. La estructura interna de la mayoría de los semiconductores inorgánicos, como el silicio, es simétrica, lo que significa que los electrones se mueven a través de ellos sin ninguna dirección preferida. Sin embargo, en la naturaleza, las moléculas a menudo tienen una estructura quiral (izquierda o derecha): al igual que las manos humanas, las moléculas quirales son imágenes especulares entre sí. La quiralidad juega un papel importante en procesos biológicos como la formación de ADN, pero es un fenómeno difícil de aprovechar y controlar en la electrónica. Pero mediante el uso de trucos de diseño molecular inspirados en la naturaleza, los investigadores crearon un semiconductor quiral empujando pilas de moléculas semiconductoras para formar columnas espirales diestras o zurdas ordenadas. Su resultados se informan en la revista Ciencia. Una aplicación prometedora para semiconductores quirales está en la tecnología de visualización. Las pantallas actuales a menudo desperdician una cantidad significativa de energía debido a la forma en que las pantallas filtran la luz. El semiconductor quiral desarrollado por los investigadores emite luz de forma natural de una manera que podría reducir estas pérdidas, haciendo que las pantallas sean más brillantes y más eficientes energéticamente. “Cuando comencé a trabajar con semiconductores orgánicos, muchas personas dudaban de su potencial, pero ahora dominan la tecnología de pantallas,” dijo el profesor Sir Richard Friend del Laboratorio Cavendish de Cambridge, quien codirigió la investigación. “A diferencia de los semiconductores inorgánicos rígidos, los materiales moleculares ofrecen una flexibilidad increíble—, lo que nos permite diseñar estructuras completamente nuevas, como LED quirales. Es como trabajar con un conjunto de Lego con todo tipo de formas que puedas imaginar, en lugar de solo ladrillos rectangulares El semiconductor se basa en un material llamado triazatruxeno (TAT) que se autoensambla en una pila helicoidal, permitiendo que los electrones giren en espiral a lo largo de su estructura, como el hilo de un tornillo. “Cuando se excita con luz azul o ultravioleta, el TAT autoensamblado emite luz verde brillante con una fuerte polarización circular, un efecto que hasta ahora ha sido difícil de lograr en los semiconductores, dijo el coautor Marco Preuss, de la Universidad Tecnológica de Eindhoven. “La estructura de TAT permite que los electrones se muevan de manera eficiente mientras afectan la forma en que se emite la luz.” Al modificar las técnicas de fabricación de OLED, los investigadores incorporaron con éxito TAT en el trabajo de OLED polarizados circularmente (CP-OLED). Estos dispositivos mostraron niveles récord de eficiencia, brillo y polarización, lo que los convierte en los mejores de su tipo. “Weimve esencialmente reelaboró la receta estándar para hacer OLED como lo tenemos en nuestros teléfonos inteligentes, lo que nos permite atrapar una estructura quiral dentro de una matriz estable y no cristalizante, dijo el coautor Rituparno Chowdhury, del Laboratorio Cavendish de Cambridge. “Esto proporciona una forma práctica de crear LED polarizados circularmente, algo que ha eludido durante mucho tiempo el campo El trabajo es parte de una colaboración de décadas entre el grupo de investigación Friendiends y el grupo del profesor Bert Meijer de la Universidad Tecnológica de Eindhoven. “Este es un verdadero avance en la fabricación de un semiconductor quiral,” dijo Meijer. “Al diseñar cuidadosamente la estructura molecular, weisve acopló la quiralidad de la estructura al movimiento de los electrones y thatis nunca se había hecho en este nivel antes.” Los semiconductores quirales representan un paso adelante en el mundo de los semiconductores orgánicos, que ahora respaldan una industria por valor de más de $60 mil millones (aproximadamente £45 mil millones). Más allá de las pantallas, este desarrollo también tiene implicaciones para la computación cuántica y la espintrónica, un campo de investigación que utiliza el espín, o momento angular inherente, de los electrones para almacenar y procesar información, lo que podría conducir a sistemas informáticos más rápidos y seguros. La investigación fue apoyada en parte por la Red de Formación Marie Curie de la Unión Europea y el Consejo Europeo de Investigación. Richard Friend es miembro de St Johns College, Cambridge. Rituparno Chowdhury es miembro de Fitzwilliam College, Cambridge. Referencia Rituparno Chowdhury, Marco D Preuss et al. ‘Electroluminiscencia polarizada circularmente a partir de películas delgadas semiconductoras supramoleculares quirales.’ Ciencia (2025). DOI:10.1126/ciencia.adt3011 Universidad de Cambridge News. Traducido al español

Leer más »
Scroll al inicio