Si las máquinas pueden aprender cómo razonamos, también podrán ayudarnos a entender por qué lo hacemos.
Centaur es un nuevo modelo de inteligencia artificial diseñado para imitar el razonamiento humano. Desarrollado en Llama 3.1 de Meta y entrenado con más de 10 millones de decisiones de 160 estudios de psicología , aborda problemas de lógica, dilemas morales y decisiones cotidianas para descubrir los patrones subyacentes al pensamiento humano. Los investigadores lo consideran una herramienta de descubrimiento, que se comporta de forma lo suficientemente similar a una persona como para revelar información que los modelos tradicionales podrían pasar por alto.
«Estoy entusiasmado por utilizar el modelo para aprender algo sobre la mente humana», dijo Marcel Binz , director adjunto del Instituto de IA centrada en el ser humano en Helmholtz Munich y autor principal del estudio que describe a Centaur, en una entrevista con IBM Think .
Un espejo conductual para la ciencia cognitiva
La mayoría de los modelos cognitivos reducen los experimentos a cifras puras. Centaur hace lo contrario. Lee cada tarea en su totalidad, con instrucciones en lenguaje natural y cada paso de la respuesta humana. El modelo se entrenó con un conjunto de datos llamado Psicología 101 , una colección de problemas clásicos de psicología que incluye desde acertijos visuales y pruebas de memoria hasta dilemas morales y juegos de lenguaje. Al ver la misma información que vería una persona, Centaur aprende a seguir la tarea como un humano.
Este enfoque permitió una generalización mucho más allá de los datos de entrenamiento. Cuando los investigadores reformularon un problema estándar de aprendizaje por refuerzo, cambiando el enfoque de astronautas a alfombras mágicas, Centaur siguió mostrando las mismas tendencias de comportamiento. También tuvo un buen rendimiento en tareas completamente nuevas, como los acertijos de lógica tipo LSAT.
El uso del lenguaje, en lugar de descripciones numéricas concisas, fue deliberado. «Queríamos que el modelo viera lo que veían los participantes», explicó Binz. «Instrucciones completas, contexto completo. Sin atajos».
Centaur no está diseñado para explicar el funcionamiento del cerebro. En cambio, se centra en reproducir lo que las personas hacen en estudios de comportamiento. Esta capacidad predictiva tiene implicaciones inmediatas para los investigadores, quienes a menudo dependen de modelos estrechos y manuales para cada tipo de función cognitiva.
Russell Poldrack , profesor de Psicología en la Universidad de Stanford que no participó en el proyecto, considera a Centaur como parte de un cambio más amplio en el campo.
“Históricamente, les hemos dado a los modelos versiones muy reducidas de las tareas”, declaró a IBM Think en una entrevista. “Ahora, podemos darles lo que le daríamos a una persona y ver un comportamiento que refleja lo que haría una persona”.
La diferencia no radica solo en la escala, sino también en la intención. La mayoría de los modelos cognitivos se construyen para explicar un comportamiento específico. Centaur está diseñado para observar y replicar el comportamiento en diferentes dominios, como el razonamiento visual y las tareas de memoria. Esto abre la posibilidad de descubrir nuevos patrones que, de otro modo, los investigadores podrían pasar por alto.
En un ejemplo del estudio, el equipo examinó cómo las personas eligen entre productos con múltiples valoraciones de expertos. El comportamiento de Centaur reveló una estrategia de dos pasos: inicialmente, las personas parecían contar las valoraciones positivas y solo utilizaban la credibilidad de los expertos como criterio de desempate. Esta perspectiva condujo a un nuevo modelo interpretable de la toma de decisiones humana, que Centaur logró replicar tras perfeccionarlo.
«No pretendemos reemplazar los modelos cognitivos», dijo Binz. «Queremos brindar a los investigadores mejores herramientas para explorar lo que las personas podrían estar haciendo».
IBM Blog. S. B. Traducido al español