En la semana 3 del curso en línea de Aprendizaje de IA , cada participante comenzó a
construir su propio chatbot funcional .
Para ello, tuvimos que utilizar un tema con el que estuviéramos familiarizados para asegurarnos de que más tarde pudiéramos verificar la precisión de los resultados de nuestros chatbots. También necesitábamos recopilar y cargar conjuntos de datos, redactar indicaciones del sistema y elegir un modelo de lenguaje grande (LLM) para cada bot.
Todos estos pasos deben tomarse con cuidado. Como creadores de los chatbots, nuestras elecciones sirven como límites para nuestros chatbots , influyendo en su nivel de imprevisibilidad, a menudo denominado «alucinaciones» , aunque prefiero el término «aleatoriedad» porque parece más preciso. La aleatoriedad refleja con mayor precisión la forma en que estos resultados inesperados surgen de la compleja interacción de datos y algoritmos (he explorado el concepto de aleatoriedad con más detalle en la parte 2.5 de mi serie de blogs). Pero volvamos a nuestra tarea.
El propósito es personal
La naturaleza diseña todo generosamente para nosotros, pero en el ámbito tecnológico debemos elaborar nuestras creaciones con mucho cuidado. El diseño de nuestros robots comienza por darles un propósito . Estoy creando dos robots y su propósito, francamente, es personal. Ambos servirán a mis objetivos personales, pero espero que el resultado final también sea útil para otros.
¿Cuáles son entonces sus propósitos? Mis robots están diseñados para ayudarme a superar mis limitaciones humanas. Dicho de otra forma, su propósito es ampliar mis capacidades. Más concretamente, me permitirán mantener el ritmo de la velocidad y el alcance de las publicaciones en mi campo de investigación.
¿Cómo? Mejorando mis capacidades de procesamiento y memoria, que son naturalmente limitadas . Un bot se dedicará a preservar y ampliar mis conocimientos adquiridos sobre el tema de la «seguridad infantil en el metaverso», mientras que el otro me ayudará a examinar la avalancha de documentos publicados recientemente por la UIT como parte de la Iniciativa de Mundos Virtuales de la ONU. Para decirlo sucintamente: estos bots serán una extensión de mí . Son, después de todo, artefactos.
Empecemos.
La relación entre los avisos del sistema y los LLM
La existencia de nuestros bots comienza con la provisión de indicaciones del sistema . En la metáfora de Geppetto que utilicé en mi primera publicación, estas indicaciones equivaldrían a tomar un trozo de madera y comenzar a cincelar los contornos de Pinocho. Los carpinteros experimentados saben que cada pieza de madera tiene su propio carácter, expresado a través de su veta y otras cualidades. Nuestras indicaciones del sistema sirven como modelo fundamental para nuestros chatbots, definiendo su propósito central y guiando su desarrollo . Son como la visión inicial de Geppetto de Pinocho como un títere con el potencial de convertirse en un niño. Los LLM son donde ocurre la magia.
Piense en un LLM como la fuerza que anima a Pinocho al permitirle hablar de manera similar a la humana; proporciona los patrones lingüísticos y la comprensión fundamentales, extraídos de un vasto bosque de información. En nuestro caso, se trata de estadísticas y reconocimiento de patrones, no de magia.
Los datos y el bosque de información
En la segunda parte de esta serie de blogs, exploramos cómo la IA interpreta los datos mediante la identificación de patrones y correlaciones, de forma similar a cómo las banderas transmiten significado a través de colores y símbolos. Ahora, imaginemos que Internet es un vasto bosque lleno de diferentes tipos de madera, cada uno con su propia textura y resistencia. Esta es la materia prima a partir de la cual se tallará nuestro chatbot.
Nuestro conjunto de datos cuidadosamente seleccionado es como una selección de bloques de madera de alta calidad, elegidos por sus propiedades específicas. Esto garantiza que el chatbot aprenda de información confiable y relevante. El LLM, a su vez, ayuda al chatbot a «ver el bosque detrás de los árboles», revelando conexiones ocultas dentro de esta gran cantidad de datos y ensamblándolas en una estructura significativa. Guía al chatbot para navegar por el bosque y descubrir los conocimientos más relevantes para nuestras necesidades.
DiploAI como nuestro taller
Si bien los conjuntos de datos garantizan una alta calidad y relevancia para un aprendizaje automático eficaz, los datos de Internet proporcionan una amplia gama de patrones de lenguaje. Sin embargo, estos datos requieren un filtrado significativo para eliminar el ruido y las imprecisiones. DiploAI proporciona el taller, las herramientas y el entorno para dar forma a este material. Y nosotros, como escultores, utilizamos las indicaciones como nuestros cinceles, dando forma activamente a la madera (datos) y tallando la forma y las características deseadas.
Pero, ¿en qué consiste exactamente este «taller»? Pues bien, DiploAI es una plataforma de IA desarrollada por el Laboratorio de IA y Datos de Diplo. Se centra en explorar las posibilidades del aprendizaje automático, las redes neuronales y los algoritmos de procesamiento del lenguaje natural. DiploAI participa activamente en la búsqueda de nuevos conjuntos de datos, la prueba de diferentes modelos de aprendizaje automático y la difusión de los conocimientos recién adquiridos a través de un diario semanal. Desempeña un papel importante en la mejora de la comprensión de la IA y la ciencia de datos en el contexto de la diplomacia y la gobernanza global. (Si quieres saber más sobre DiploAI y sus actividades, puedes visitar el siguiente enlace: Diplo AI .)
La IA aprende a través de la experiencia
Del mismo modo que Pinocho se encuentra con varios personajes que influyen en su camino (el Honrado Juan, Geppetto o el Hada Azul), los usuarios desempeñan un papel crucial en la configuración del desarrollo del chatbot. Sus interacciones, comentarios e incluso malentendidos brindan información valiosa para refinar los mensajes y conjuntos de datos del sistema del chatbot.
Por ejemplo, los malentendidos frecuentes o las respuestas irrelevantes indican la necesidad de realizar ajustes en las indicaciones del sistema o los conjuntos de datos del chatbot . Los comentarios diversos de los usuarios también pueden revelar nuevas funcionalidades para el bot. Además, los usuarios pueden beneficiarse de aprender más sobre las habilidades que necesitan adquirir para comunicarse con las tecnologías emergentes y utilizarlas.
Inteligencia artificial a medida para la diplomacia y la gobernanza global
Lo que hace que el enfoque de Diplo hacia la IA sea tan sobresaliente es que el taller es independiente del LLM individual. Podemos hacer nuestro Pinocho a partir de roble, caoba o pino con un clic del mouse. Podríamos decir que está hecho a medida, no es algo listo para usar. Esto también significa que conservamos la propiedad y el control sobre nuestra IA , a diferencia de depender de soluciones preconstruidas de grandes empresas tecnológicas. Si bien inicialmente elegí un LLM subyacente particular para darle vida a este modelo, el bot en sí no está vinculado a este modelo específico.
Dado que entre los participantes del curso de aprendizaje de IA se incluyen personas de la diplomacia, la gobernanza global y las relaciones internacionales, DiploAI proporciona algunos elementos importantes:
- Especificidad del dominio de DiploAI: DiploAI está diseñado para comprender y analizar textos específicos de la diplomacia, la gobernanza global y campos relacionados. Esta especificidad del dominio le permite proporcionar información más precisa y relevante adaptada a las necesidades de diplomáticos, responsables de políticas e investigadores en estas áreas.
- Asistente de IA personalizable: DiploAI permite la creación de asistentes de IA personalizables que pueden ajustarse para abordar los requisitos específicos de la formación, la investigación y los cursos diplomáticos. Esta personalización garantiza que los asistentes de IA puedan respaldar y mejorar eficazmente los procesos de aprendizaje y toma de decisiones en el ámbito de la diplomacia y la gobernanza global.
- Técnica de generación aumentada por recuperación (RAG): DiploAI utiliza técnicas avanzadas para combinar las fortalezas de los conjuntos de datos seleccionados y los LLM, lo que le permite generar respuestas más precisas y relevantes en entornos diplomáticos.
- Aprendizaje y conocimientos mejorados: al estar diseñado a medida para contextos diplomáticos y políticos, DiploAI puede proporcionar conocimientos, análisis y recomendaciones más profundos que son específicamente relevantes para los desafíos y oportunidades que se enfrentan en el campo de la diplomacia y la gobernanza global.
En general, la especialización y personalización de DiploAI lo convierten en una herramienta valiosa para apoyar las actividades diplomáticas, mejorar la investigación en gobernanza global y facilitar la toma de decisiones informada en el complejo mundo de las relaciones internacionales.
Al igual que Pinocho, la esencia de mi chatbot reside en sus indicaciones del sistema, que le permiten adaptarse y volver a implementarse con diferentes LLM a medida que evoluciona la tecnología. Esto garantiza su longevidad, adaptabilidad y la independencia tan necesaria en el panorama en constante cambio de la IA.
Elementos en el diseño de un chatbot
Veamos los distintos roles que configuran nuestra relación con la IA:
- El aprendiz (nosotros): el creador, artesano, escultor o Geppetto. Somos la fuerza impulsora detrás de la creación del chatbot. Tenemos la visión (propósito), proporcionamos la orientación y damos forma activamente a las capacidades del bot utilizando nuestras indicaciones.
- El sistema indica: El cincel o plano del escultor. Esta es nuestra herramienta principal para dar forma al LLM. Define el propósito del bot, guía su comportamiento y establece los límites para sus acciones. Es un conjunto dinámico de instrucciones que evoluciona a través de la interacción y la retroalimentación .
- El modelo de lenguaje grande (LLM): proporciona los patrones fundamentales y la comprensión del lenguaje que permiten al bot funcionar y comunicarse de manera similar a la humana.
- Los datos: son los conocimientos que dan forma a la respuesta del chatbot. En nuestra metáfora, los datos representan los árboles dentro del bosque de información, ya sea cuidadosamente seleccionados como un conjunto de datos o extraídos de la inmensidad de Internet.
- DiploAI: El taller para diseñar chatbots. Este es el entorno en el que construimos y refinamos nuestro bot . Proporciona las herramientas, los recursos y la infraestructura para interactuar con el LLM y dar forma a su comportamiento a través de nuestras indicaciones.
- El chatbot: la pieza de trabajo o Pinocho. El bot es el producto, la materialización de nuestra visión que cobra vida a través de la interacción de nuestras indicaciones con el LLM dentro del entorno de DiploAI. Es una entidad con capacidades específicas y un propósito definido , diseñada para ser una extensión de nuestras propias habilidades. Sin embargo, no es una creación estática; evoluciona y se adapta a medida que perfeccionamos nuestras indicaciones , experimentamos con diferentes LLM y seleccionamos los datos de los que aprende. Este proceso de refinamiento continuo permite que el bot se vuelva cada vez más sofisticado y se alinee con nuestros objetivos.
- Los usuarios: los socios del chatbot en la conversación. Los humanos son parte del circuito de retroalimentación dinámico, donde sus interacciones con el bot no solo refinan su conocimiento, sino que también profundizan su comprensión del potencial de la IA.
Podemos simplemente construir un chatbot para lograr un resultado rápido, pero si nosotros, como profesionales legales y expertos en gobernanza, queremos dominar los desafíos de la gobernanza de la IA, debemos ser capaces de comprender profundamente nuestros roles mutuos. Para mí, este aprendizaje consiste en desarrollar un sentido común de las capacidades y limitaciones de los aspectos tecnológicos y humanos dentro de nuestro sistema sociotecnológico.
Esto es particularmente complicado cuando se trata de la naturaleza intangible de la IA, donde el código y los algoritmos reemplazan a la madera y los cinceles. Incluso con la útil metáfora de Pinocho, cerrar la brecha entre lo tangible y lo intangible requiere un cambio de mentalidad.
El curso en línea de Aprendizaje de IA es parte del programa Diplo AI Campus .
DiploFoundation Blog. Traducido al español