Un equipo de investigadores del MIT fundó Themis AI para cuantificar la incertidumbre del modelo de IA y abordar las brechas de conocimiento.
Los sistemas de inteligencia artificial como ChatGPT ofrecen respuestas plausibles a cualquier pregunta. Sin embargo, no siempre revelan las lagunas en su conocimiento ni las áreas donde presentan incertidumbre. Este problema puede tener graves consecuencias, ya que los sistemas de IA se utilizan cada vez más para tareas como desarrollar fármacos, sintetizar información y conducir vehículos autónomos.
Ahora, Themis AI, una empresa derivada del MIT, ayuda a cuantificar la incertidumbre de los modelos y a corregir los resultados antes de que causen problemas mayores. Su plataforma Capsa puede funcionar con cualquier modelo de aprendizaje automático para detectar y corregir resultados poco fiables en segundos. Funciona modificando los modelos de IA para que detecten patrones en el procesamiento de datos que indiquen ambigüedad, incompletitud o sesgo.
“La idea es tomar un modelo, integrarlo en Capsa, identificar sus incertidumbres y modos de fallo, y luego mejorarlo”, afirma Daniela Rus, cofundadora de Themis AI y profesora del MIT, quien también dirige el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL). “Nos entusiasma ofrecer una solución que pueda mejorar los modelos y garantizar su correcto funcionamiento”.
Rus fundó Themis AI en 2021 junto con Alexander Amini (promoción de 2017, SM (promoción de 2018, PhD (promoción de 2022)) y Elaheh Ahmadi (promoción de 2020, MEng (promoción de 2021), dos antiguos investigadores asociados de su laboratorio. Desde entonces, han ayudado a empresas de telecomunicaciones con la planificación y automatización de redes, a empresas de petróleo y gas a utilizar la IA para comprender imágenes sísmicas y han publicado artículos sobre el desarrollo de chatbots más fiables.
“Queremos integrar la IA en las aplicaciones más importantes de cada sector”, afirma Amini. “Todos hemos visto ejemplos de IA con alucinaciones o errores. A medida que la IA se implementa de forma más generalizada, esos errores podrían tener consecuencias devastadoras. Themis permite que cualquier IA pueda predecir sus propios fallos antes de que ocurran”.
Ayudando a los modelos a saber lo que no saben
El laboratorio de Rus lleva años investigando la incertidumbre de los modelos. En 2018, recibió financiación de Toyota para estudiar la fiabilidad de una solución de conducción autónoma basada en aprendizaje automático.
“Ese es un contexto crítico para la seguridad donde comprender la confiabilidad del modelo es muy importante”, afirma Rus.
En un trabajo independiente , Rus, Amini y sus colaboradores desarrollaron un algoritmo capaz de detectar sesgos raciales y de género en sistemas de reconocimiento facial y reponderar automáticamente los datos de entrenamiento del modelo, demostrando que eliminaba el sesgo. El algoritmo funcionaba identificando las partes no representativas de los datos de entrenamiento subyacentes y generando nuevas muestras de datos similares para reequilibrarlos.
En 2021, los futuros cofundadores demostraron que un enfoque similar podría utilizarse para ayudar a las compañías farmacéuticas a usar modelos de IA para predecir las propiedades de los fármacos candidatos. Ese mismo año, fundaron Themis AI.
“Guiar el descubrimiento de fármacos podría ahorrar mucho dinero”, afirma Rus. “Ese fue el caso práctico que nos hizo comprender el potencial de esta herramienta”.
Actualmente, Themis AI colabora con empresas de diversos sectores, y muchas de ellas desarrollan grandes modelos lingüísticos. Gracias a Capsa, estos modelos pueden cuantificar su propia incertidumbre para cada resultado.
“Muchas empresas están interesadas en usar programas de maestría en derecho basados en sus datos, pero les preocupa la fiabilidad”, observa Stewart Jamieson (SM ’20, PhD ’24), director de tecnología de Themis AI. “Ayudamos a los estudiantes de maestría en derecho a autodeclarar su confianza e incertidumbre, lo que permite responder preguntas con mayor fiabilidad y detectar resultados poco fiables”.
Themis AI también está en conversaciones con empresas de semiconductores que construyen soluciones de IA en sus chips que pueden funcionar fuera de los entornos de nube.
“Normalmente, estos modelos más pequeños que funcionan en teléfonos o sistemas integrados no son muy precisos en comparación con lo que se podría ejecutar en un servidor, pero podemos obtener lo mejor de ambos mundos: baja latencia y computación en el borde eficiente sin sacrificar la calidad”, explica Jamieson. “Vemos un futuro donde los dispositivos en el borde realizan la mayor parte del trabajo, pero cuando no están seguros de su resultado, pueden reenviar esas tareas a un servidor central”.
Las compañías farmacéuticas también pueden utilizar Capsa para mejorar los modelos de IA que se utilizan para identificar fármacos candidatos y predecir su rendimiento en ensayos clínicos.
“Las predicciones y los resultados de estos modelos son muy complejos y difíciles de interpretar; los expertos dedican mucho tiempo y esfuerzo a comprenderlos”, comenta Amini. “Capsa puede brindar información desde el principio para comprender si las predicciones están respaldadas por la evidencia del conjunto de entrenamiento o son solo especulaciones sin fundamento. Esto puede acelerar la identificación de las predicciones más sólidas, y creemos que tiene un enorme potencial para el bien común”.
Investigación para el impacto
El equipo de Themis AI cree que la empresa está bien posicionada para mejorar la vanguardia de la tecnología de IA en constante evolución. Por ejemplo, la empresa está explorando la capacidad de Capsa para mejorar la precisión en una técnica de IA conocida como razonamiento en cadena de pensamiento, en la que los LLM explican los pasos que siguen para llegar a una respuesta.
“Hemos visto indicios de que Capsa podría ayudar a guiar esos procesos de razonamiento para identificar las cadenas de razonamiento de mayor confianza”, afirma Jamieson. “Creemos que esto tiene importantes implicaciones para mejorar la experiencia LLM, reducir las latencias y los requisitos computacionales. Es una oportunidad de gran impacto para nosotros”.
Para Rus, quien ha cofundado varias empresas desde que llegó al MIT, Themis AI es una oportunidad para garantizar que su investigación en el MIT tenga impacto.
“Mis estudiantes y yo nos apasionamos cada vez más por ir más allá y hacer que nuestro trabajo sea relevante para el mundo”, dice Rus. “La IA tiene un enorme potencial para transformar las industrias, pero también plantea inquietudes. Lo que me entusiasma es la oportunidad de ayudar a desarrollar soluciones técnicas que aborden estos desafíos y, además, fomenten la confianza y el entendimiento entre las personas y las tecnologías que se están convirtiendo en parte de su vida diaria”. MIT News. Z. W. Traducido al español