El Portal de las Tecnologías para la Innovación

¿Qué LLM codificar en cobol? Surge un punto de referencia específico

Se crea un punto de referencia específico para la generación de código cobol, basado en el conjunto de datos HumanEval.

¿Cómo crear un punto de referencia específico para la generación de código cobol? Adaptando un conjunto de datos existente .

Una start-up americana ha elegido esta opción. Se basó en la referencia HumanEval . El resultado es … COBOLEval.

De los 164 problemas de Python en HumanEval, 146 han sido traducidos. En particular, se ignoraron aquellos que aceptan o devuelven tipos que son difíciles de representar en cobol, como Any y Dict.

Las funciones al no existir en Cobol, era necesario utilizar subrutinas (definición de argumentos y variables de retorno en la sección de conexión).

Otra molestia: en cobol, no hay cadenas, números enteros o matrices de longitud variable. Debes especificar, en la cláusula PICTURE, el número de caracteres ocupados en memoria. Un problema resuelto estableciendo un techo: COBOLEval no acepta ni devuelve elementos de longitud superior a 100.

Cobol, no en ningún otro lugar, no tiene variables locales. Deberán declararse previamente, en el denominado apartado de almacenamiento de trabajo. Conciliar esta estricta estructura con el funcionamiento de los LLM implicó técnicas de descomposición y relleno .

Cada problema tiene, en promedio, seis pruebas. Una respuesta debe ser correcta para que se considere correcta. COBOLEval utiliza el compilador GnuCOBOL, recientemente incorporado en Francia a la Base Interministerial de Software Libre.

Los autores de COBOLEval también han desarrollado un LLM “cobol especial”: mAInframer-1, con Code Llama como base. Comunican su rendimiento en condiciones muy específicas: generación de una única solución (pasada@1) con temperatura a 0.

ModeloTasa de respuestas correctasTasa de compilación con GnuCOBOL
GPT-3.5 Turbo4.1119.17
GPT-48.947,94
Código de llama 7B0,6825.34
Código Llama 13B1.3613.01
Código de llama 34B2.0578,76
Marco principal 7B6.1669,17
Marco principal 13B8.954.1
Marco principal 34B10.2773,97


Ilustración © Quardia Inc. – Adobe Sto
ck. NetMedia,Francia.BC. Traducido al español

Artículos relacionados

Ubisoft

Assassin’s Creed Mirage: Valle de los Recuerdos se publica gratis el 18 de noviembre

Valle de los Recuerdos es una actualización gratuita para todos los jugadores de Assassin’s Creed Mirage que ofrece hasta seis horas de juego e historia adicionales. La historia de Valle de los Recuerdos se ambienta antes del final de la aventura principal y empieza cuando Basim descubre que su padre desaparecido podría encontrarse en Al-Ula. Basim emprende un viaje para comprobar si los rumores son ciertos, pero descubre que una peligrosa banda de ladrones amenaza el valle de Al-Ula y que su padre ha desaparecido.

Continuar leyendo...
Huawei

Huawei presenta su visión de sinergia submarino-terrestre y orquestación óptica-inteligente

Huawei presentó su visión de sinergia submarino-terrestre y orquestación óptica-inteligente. En su debut en Submarine Networks World 2025, el principal evento de comunicaciones submarinas en Singapur, la compañía presentó una solución innovadora y productos estrella diseñados para facilitar la integración y la sinergia eficiente entre las redes submarinas y terrestres.

Continuar leyendo...
Scroll al inicio