El Portal de las Tecnologías para la Innovación

La IA no puede ver tan bien como los humanos y cómo solucionarlo

Fuente:

Un estudio de la EPFL revela por qué los humanos son excelentes en reconocer objetos a partir de fragmentos mientras que la IA tiene dificultades, destacando el papel fundamental de la integración de contornos en la visión humana.

A diario, reconocemos sin esfuerzo a nuestros amigos entre la multitud o identificamos formas familiares, incluso si están parcialmente ocultas. Nuestro cerebro ensambla fragmentos para formar objetos completos, llenando los espacios en blanco y dando sentido a un mundo a menudo caótico.

Esta capacidad se denomina «integración de contornos» y es algo que incluso los sistemas de IA más inteligentes aún encuentran difícil de lograr. A pesar de los notables logros de la inteligencia artificial en el reconocimiento de imágenes, las IA aún tienen dificultades para generalizar a partir de información visual incompleta o errada.

Cuando los objetos se ocultan parcialmente, se borran o se fragmentan, la mayoría de los modelos de IA fallan, clasifican erróneamente o se rinden. Esto puede ser un problema grave en la vida real, dada nuestra creciente dependencia de la IA para aplicaciones prácticas como los coches autónomos, las prótesis y la robótica.

El Laboratorio de NeuroIA de la EPFL , dirigido por Martin Schrimpf, se propuso comparar sistemáticamente cómo las personas y la IA gestionan los rompecabezas visuales. Ben Lönnqvist , estudiante de posgrado de EDNE y autor principal del estudio, colaboró con el Laboratorio de Psicofísica de Michael Herzog para desarrollar una serie de pruebas de reconocimiento en las que tanto humanos como más de 1000 redes neuronales artificiales debían identificar objetos con contornos faltantes o fragmentados. Sus resultados demuestran que, en cuanto a la integración de contornos, los humanos superan sistemáticamente a la IA de vanguardia, y explican por qué.

Los humanos pueden identificar objetos a partir de datos parciales, mientras que las IA tienen dificultades. Crédito: Ben Lönnvist (EPFL)

La investigación fue presentada en la Conferencia Internacional sobre Aprendizaje Automático de 2025 (ICML) .

El equipo organizó una prueba de reconocimiento de objetos en un laboratorio con cincuenta voluntarios. Los participantes visualizaron imágenes de objetos cotidianos como tazas, sombreros, sartenes, etc., cuyos contornos se borraban o segmentaban sistemáticamente. En ocasiones, solo el 35 % de los contornos de un objeto permanecía visible. Paralelamente, el equipo asignó la misma tarea a más de 1000 modelos de IA, incluyendo algunos de los sistemas más potentes disponibles.

El experimento abarcó 20 condiciones diferentes, variando el tipo y la cantidad de información visual. El equipo comparó el rendimiento en estas condiciones, midiendo la precisión y analizando cómo respondían tanto humanos como máquinas a acertijos visuales de dificultad creciente.

Los humanos demostraron una robustez notable, alcanzando a menudo una precisión del 50 % incluso cuando faltaba la mayor parte del contorno de un objeto. En cambio, los modelos de IA tendían a caer en conjeturas aleatorias en las mismas circunstancias. Solo los modelos entrenados con miles de millones de imágenes se acercaron al rendimiento humano; incluso entonces, tuvieron que adaptarse específicamente a las imágenes del estudio.

Al profundizar más, los investigadores descubrieron que los humanos muestran una preferencia natural por reconocer objetos cuando las partes fragmentadas apuntan en la misma dirección, lo que el equipo denominó «sesgo de integración». Los modelos de IA entrenados para desarrollar un sesgo similar obtuvieron mejores resultados al enfrentarse a distorsiones de imagen. El entrenamiento de sistemas de IA diseñados específicamente para integrar contornos mejoró su precisión y les permitió centrarse más en la forma del objeto que en la textura de la superficie.

Estos resultados sugieren que la integración de contornos no es una característica innata, sino que puede aprenderse con la experiencia. Para las industrias que dependen de la visión artificial, como los vehículos autónomos o la imagenología médica, desarrollar una IA que vea el mundo de forma más similar a la nuestra podría significar una tecnología más segura y fiable.

El trabajo también demuestra que la mejor forma de cerrar la brecha no es modificando las arquitecturas de IA, sino dándoles a las máquinas una dieta visual más “humana”, incluyendo múltiples imágenes del mundo real donde los objetos a menudo están parcialmente ocultos.

Referencias

Ben Lönnqvist, Elsa Scialom, Abdulkadir Gokce, Zehra Merchant, Michael H. Herzog, Martin Schrimpf. La integración de contornos es la base de una visión similar a la humana. ArXiv: 2504.05253

EPFL News. N. P. Traducido al español

Artículos relacionados

Huawei

Huawei presenta su visión de sinergia submarino-terrestre y orquestación óptica-inteligente

Huawei presentó su visión de sinergia submarino-terrestre y orquestación óptica-inteligente. En su debut en Submarine Networks World 2025, el principal evento de comunicaciones submarinas en Singapur, la compañía presentó una solución innovadora y productos estrella diseñados para facilitar la integración y la sinergia eficiente entre las redes submarinas y terrestres.

Continuar leyendo...
Nintendo

¡Despega con Mario en dos aventuras que desafían la gravedad!

¿Listo para explorar los confines del espacio? Super Mario Galaxy™ y Super Mario Galaxy 2 son dos aventuras icónicas de Mario, conocidas por sus plataformas desenfrenadas, sorpresas cósmicas y una banda sonora orquestada y envolvente. (Ah, y un dato curioso: ¡Super Mario Galaxy también fue la primera aparición de Rosalina y los Lumas!)

Continuar leyendo...
Scroll al inicio