El Portal de las Tecnologías para la Innovación

¿Qué LLM codificar en cobol? Surge un punto de referencia específico

Se crea un punto de referencia específico para la generación de código cobol, basado en el conjunto de datos HumanEval.

¿Cómo crear un punto de referencia específico para la generación de código cobol? Adaptando un conjunto de datos existente .

Una start-up americana ha elegido esta opción. Se basó en la referencia HumanEval . El resultado es … COBOLEval.

De los 164 problemas de Python en HumanEval, 146 han sido traducidos. En particular, se ignoraron aquellos que aceptan o devuelven tipos que son difíciles de representar en cobol, como Any y Dict.

Las funciones al no existir en Cobol, era necesario utilizar subrutinas (definición de argumentos y variables de retorno en la sección de conexión).

Otra molestia: en cobol, no hay cadenas, números enteros o matrices de longitud variable. Debes especificar, en la cláusula PICTURE, el número de caracteres ocupados en memoria. Un problema resuelto estableciendo un techo: COBOLEval no acepta ni devuelve elementos de longitud superior a 100.

Cobol, no en ningún otro lugar, no tiene variables locales. Deberán declararse previamente, en el denominado apartado de almacenamiento de trabajo. Conciliar esta estricta estructura con el funcionamiento de los LLM implicó técnicas de descomposición y relleno .

Cada problema tiene, en promedio, seis pruebas. Una respuesta debe ser correcta para que se considere correcta. COBOLEval utiliza el compilador GnuCOBOL, recientemente incorporado en Francia a la Base Interministerial de Software Libre.

Los autores de COBOLEval también han desarrollado un LLM “cobol especial”: mAInframer-1, con Code Llama como base. Comunican su rendimiento en condiciones muy específicas: generación de una única solución (pasada@1) con temperatura a 0.

ModeloTasa de respuestas correctasTasa de compilación con GnuCOBOL
GPT-3.5 Turbo4.1119.17
GPT-48.947,94
Código de llama 7B0,6825.34
Código Llama 13B1.3613.01
Código de llama 34B2.0578,76
Marco principal 7B6.1669,17
Marco principal 13B8.954.1
Marco principal 34B10.2773,97


Ilustración © Quardia Inc. – Adobe Sto
ck. NetMedia,Francia.BC. Traducido al español

Artículos relacionados

Electronic Arts

Battlefield Studios: cuatro equipos, un juego innovador

Desde 2002, Battlefield ha sido un pilar en el consolidado género FPS multijugador, capturando los corazones y mentes de personas de todo el mundo con su inigualable escala innovadora, batallas explosivas y guerra sin cuartel.

Ahora, por primera vez en la historia de Battlefield, una fusión de talento distribuido entre cuatro estudios de desarrollo de renombre y clase mundial, se ha unido con una visión: crear el mejor Battlefield de la historia.

Continuar leyendo...
IBM

Cómo la IA está transformando la pirámide del modelo de negocio bancario: Sibos 2025

En su charla sobre «Escalando la IA en la banca», Ramamurthy exploró cómo las instituciones financieras con visión de futuro están pasando de la experimentación con IA a la ejecución. Se centró en «los tres aspectos que quitan el sueño a los CEO y CXO»: crecimiento y rendimiento, costes y eficiencia, y cumplimiento normativo y mitigación de riesgos. La IA será fundamental para estos tres, explicó.

Continuar leyendo...
Scroll al inicio