IA y bienes comunes digitales: 7 proyectos franceses a seguir

La convocatoria de proyectos “Digital Commons for Generative Artificial Intelligence” tiene sus primeros ganadores. Quienes son ?

¿Quién creará y hará accesibles los bienes comunes digitales en la cadena de IA generativa?

A mediados de 2023, el Estado lanzó una convocatoria de proyectos sobre este tema. Áreas principales: bases de datos (“mejorando la herencia francesa”), modelos (generales o adaptados a casos de uso empresarial), API y herramientas de evaluación.

En mayo, al margen de la feria Viva Tech, el Gobierno anunció una primera serie de ganadores. Siete en este caso. Aquí están, en orden alfabético.

IA para la democracia

Este proyecto forma parte del programa de investigación “Democratic Commons”, en cuyo origen se encuentran Make.org , Sciences Po , la Universidad de la Sorbona y el CNRS . La iniciativa ha atraído, entre otros, a Hugging Face, Mozilla.ai y Aspen Institutes Network.

“Más de 50 investigadores” tendrán dos años para desarrollar y compartir en código abierto:

– Un marco científico para determinar los principios democráticos aplicados a la IA
– Un modelo para evaluar los sesgos de los LLM en relación con estos principios
– LMM “dessesgados” y plataformas de participación ciudadana consistentes con estos mismos principios

El CNRS y el Inria están representados en el consejo científico, junto con Yale y, en particular, la OCDE.

ArGiMi

El proyecto reúne Artefact (integración de IA en aplicaciones industriales), Giskard (evaluación de modelos) y Mistral AI . Su objetivo es crear LLM francófonos adaptados a las necesidades específicas de las empresas. Incluye el desarrollo de herramientas destinadas a simplificar el ajuste, incluidos conjuntos de datos de código abierto .

Los actores públicos (INA, BnF) y privados (Ardian, Cdiscount, Crédit Mutuel Arkéa) están al tanto. CentraleSupélec también, para crear un equipo mixto de investigación.

CC-SWH

Esta iniciativa se basa en Software Heritage (proyecto de preservación del código fuente de Inria). Se pretende desarrollar, sobre esta base, un modelo de generación de código informático.

El archivo Software Heritage ya ha permitido producir el modelo StarCoder, como parte de BigCode. Es el tema de otros proyectos, incluido SWH Sec, destinado a desarrollar una plataforma semiautomática de análisis y remediación de vulnerabilidades.

OpenLLM-Francia

LINAGORA es líder de este consorcio formado como extensión de la comunidad del mismo nombre (nacida a mediados de 2023).

OpenLLM-France pretende, en particular, proporcionar bienes comunes digitales para la implementación de la IA en la educación nacional. Esto implicará la provisión, a través de chat y API, de un LLM previamente capacitado que aproveche los recursos educativos abiertos.

El trabajo realizado fuera de la AAP dio como resultado la publicación de un modelo 7B (Claire) que debería servir como base a perfeccionar para comprender y generar diálogo. Existen variantes basadas en Mistral 7B y Falcon-7B (con, para este último, las versiones CC-BY-NC-SA 4.0 y Apache 2.0 .

sala de fotos

Este proyecto tiene como objetivo desarrollar un modelo de texto a imagen que promueva el patrimonio francés. La empresa del mismo nombre lo lleva. Nacida en 2019, recientemente recaudó 40 millones de euros en la serie B. Su primer producto fue una herramienta de eliminación de fondo. Su oferta actual incluye generación de imágenes y pintura exterior , además de diversos efectos visuales.

PODRIA

Este proyecto debería resultar en un sistema de evaluación LLM. Su portador: Dust , una empresa parisina fundada que cuenta entre sus fundadores con un ex empleado de OpenAI.

Dust proporciona un conjunto de herramientas para implementar soluciones de IA generativa en las empresas. Se dirige especialmente a casos de colaboración interna. Sus principales referentes están en el sector fintech. Sequoia Capital ha puesto sus canicas allí.

Escriba

Scribe es un programa de desarrollo de modelos sectoriales. En primera línea, los ámbitos del derecho, la salud y la industria.

ALLONIA (plataforma DSML) forma parte del proyecto, como LightOn y el CNRS . Inria también, con su equipo ALMAnCh (procesamiento automático de lenguajes y humanidades digitales).

También se espera que Scribe produzca conjuntos de datos de alineación y herramientas de evaluación. Bouygues, La Poste y Michelin se encuentran entre los socios industriales. NetMedia, Francia.CB. Traducido al español

Comparte la nota:

Artículos relacionados

Scroll al inicio