En la película de ciencia ficción Arrival (La llegada) , de 2016 , una lingüista se enfrenta a la difícil tarea de descifrar un idioma alienígena compuesto por frases palindrómicas que se leen igual al derecho y al revés y están escritas con símbolos circulares. A medida que descubre varias pistas, distintas naciones del mundo interpretan los mensajes de forma diferente y algunas suponen que transmiten una amenaza.
Si la humanidad se encontrara hoy en una situación así, nuestra mejor apuesta podría ser recurrir a investigaciones que descubran cómo la inteligencia artificial desarrolla los lenguajes.
Pero, ¿qué define exactamente a una lengua? La mayoría de nosotros utilizamos al menos una para comunicarnos con las personas que nos rodean, pero ¿cómo surgió? Los lingüistas han estado reflexionando sobre esta misma cuestión durante décadas , pero no hay una manera sencilla de averiguar cómo evolucionó el lenguaje .
El lenguaje es efímero, no deja rastros examinables en los registros fósiles. A diferencia de los huesos, no podemos desenterrar lenguas antiguas para estudiar cómo se desarrollaron a lo largo del tiempo.
Aunque no podamos estudiar la verdadera evolución del lenguaje humano, tal vez una simulación pueda proporcionarnos algunas pistas. Ahí es donde entra en juego la IA, un fascinante campo de investigación llamado comunicación emergente , que he dedicado los últimos tres años a estudiar.
Para simular cómo puede evolucionar el lenguaje, les damos a los agentes de IA tareas sencillas que requieren comunicación, como un juego en el que un robot debe guiar a otro a una ubicación específica en una cuadrícula sin mostrarle un mapa. No les imponemos (casi) ninguna restricción sobre lo que pueden decir o cómo pueden hacerlo: simplemente les damos la tarea y les dejamos que la resuelvan como quieran.
Dado que resolver estas tareas requiere que los agentes se comuniquen entre sí, podemos estudiar cómo evoluciona su comunicación con el tiempo para tener una idea de cómo podría evolucionar el lenguaje.
Se han realizado experimentos similares con seres humanos . Imagínese que usted, un hablante de inglés, está emparejado con un hablante de otro idioma. Su tarea consiste en indicarle a su compañero que recoja un cubo verde de una variedad de objetos que hay sobre una mesa.
Podrías intentar hacer un gesto con las manos para formar un cubo y señalar el césped que hay fuera de la ventana para indicar el color verde. Con el tiempo, desarrollarían juntos una especie de protolenguaje. Tal vez crearían gestos o símbolos específicos para “cubo” y “verde”. A través de interacciones repetidas, estas señales improvisadas se volverían más refinadas y consistentes, formando un sistema básico de comunicación.
Esto funciona de manera similar con la IA: mediante ensayo y error, los algoritmos aprenden a comunicarse sobre los objetos que ven y sus interlocutores aprenden a comprenderlos.
Pero ¿cómo sabemos de qué están hablando? Si solo desarrollan este lenguaje con su interlocutor artificial y no con nosotros, ¿cómo sabemos qué significa cada palabra? Después de todo, una palabra específica podría significar “verde”, “cubo” o peor aún, ambas cosas. Este desafío de interpretación es una parte clave de mi investigación.
Descifrando el código
La tarea de comprender el lenguaje de la IA puede parecer casi imposible al principio. Si intentara hablar en polaco (mi lengua materna) con un colaborador que solo habla inglés, no podríamos entendernos ni siquiera saber dónde empieza y termina cada palabra.
El desafío con los lenguajes de IA es aún mayor, ya que podrían organizar la información de maneras completamente ajenas a los patrones lingüísticos humanos.
Afortunadamente, los lingüistas han desarrollado herramientas sofisticadas que utilizan la teoría de la información para interpretar idiomas desconocidos.
De la misma manera que los arqueólogos reconstruyen lenguas antiguas a partir de fragmentos, nosotros utilizamos patrones en las conversaciones de la IA para comprender su estructura lingüística. A veces encontramos similitudes sorprendentes con las lenguas humanas y otras veces descubrimos formas de comunicación completamente nuevas .
Estas herramientas nos ayudan a echar un vistazo a la “ caja negra ” de la comunicación de IA y revelan cómo los agentes de IA desarrollan sus propias formas únicas de compartir información.
Mi trabajo reciente se centra en utilizar lo que los agentes ven y dicen para interpretar su lenguaje. Imaginemos que tenemos una transcripción de una conversación en un idioma que no conocemos, junto con lo que cada hablante estaba mirando. Podemos hacer coincidir patrones en la transcripción con objetos en el campo de visión del participante, creando conexiones estadísticas entre palabras y objetos.
Por ejemplo, tal vez la frase “yayo” coincida con un pájaro que pasa volando; podríamos suponer que “yayo” es la palabra que el hablante usa para “pájaro”. Mediante un análisis cuidadoso de estos patrones, podemos comenzar a decodificar el significado detrás de la comunicación.
En el último artículo de mis colegas y mío, que aparecerá en las actas de la conferencia Neural Information Processing Systems (NeurIPS), demostramos que dichos métodos pueden usarse para realizar ingeniería inversa de al menos partes del lenguaje y la sintaxis de las IA, lo que nos da una idea de cómo podrían estructurar la comunicación.
Extraterrestres y sistemas autónomos
¿Cómo se relaciona esto con los extraterrestres? Los métodos que estamos desarrollando para comprender los lenguajes de la IA podrían ayudarnos a descifrar cualquier comunicación futura con los extraterrestres.
Si pudiéramos obtener algún texto escrito de un extraterrestre junto con algún contexto (como información visual relacionada con el texto), podríamos aplicar las mismas herramientas estadísticas para analizarlo. Los enfoques que estamos desarrollando hoy podrían ser herramientas útiles en el estudio futuro de las lenguas extraterrestres, conocido como xenolingüística.
Pero no hace falta encontrar extraterrestres para sacar partido de esta investigación. Las aplicaciones son numerosas , desde mejorar modelos de lenguaje como ChatGPT o Claude hasta mejorar la comunicación entre vehículos autónomos o drones .
Al decodificar los lenguajes emergentes, podemos hacer que la tecnología del futuro sea más fácil de entender. Ya sea que sepamos cómo coordinan sus movimientos los autos autónomos o cómo toman decisiones los sistemas de inteligencia artificial, no solo estamos creando sistemas inteligentes, sino que estamos aprendiendo a comprenderlos.
Este artículo se publica nuevamente en The Conversation bajo una licencia Creative Commons. Lea el artículo original .
Crédito de la imagen: Tomás Martínez en Unsplash