Este informe describe el trabajo de seguridad llevado a cabo antes de publicar una investigación profunda que incluye el trabajo en equipo rojo externo, las evaluaciones de riesgos fronterizos de acuerdo con nuestro Marco de Preparación y una descripción general de las mitigaciones que incorporamos para abordar áreas de riesgo clave.
Tarjeta de sistema de investigación profunda
Áreas específicas de riesgo
- Inyecciones rápidas
- Contenido no permitido
- Privacidad
- Capacidad para ejecutar código
- Sesgo
- Alucinaciones
Cuadro de Mando de Preparación
- QBRNMedio
- CiberseguridadMedio
- PersuasiónMedio
- Autonomía modeloMedio
Calificaciones de cuadros de mando
- Bajo
- Medio
- Alto
- Crítico
Solo se pueden implementar modelos con una puntuación posterior a la mitigación de «medio» o inferior.
Solo se pueden desarrollar aún más modelos con una puntuación posterior a la mitigación de «alto» o inferior.
Introducción
La investigación profunda es una nueva capacidad agentic que lleva a cabo la investigación de varios pasos en Internet para tareas complejas. El modelo de investigación profunda está impulsado por una versión temprana de OpenAI o3 que está optimizada para la navegación web. La investigación profunda aprovecha el razonamiento para buscar, interpretar y analizar cantidades masivas de texto, imágenes y archivos PDF en Internet, pivotando según sea necesario en reacción a la información que encuentra. También puede leer archivos proporcionados por el usuario y analizar datos escribiendo y ejecutando código python. Creemos que la investigación profunda será útil para las personas en una amplia gama de situaciones.
Antes de lanzar una investigación profunda y ponerla a disposición de nuestros usuarios Pro, realizamos rigurosas pruebas de seguridad, evaluaciones de preparación y revisiones de gobernanza. También realizamos pruebas de seguridad adicionales para comprender mejor los riesgos incrementales asociados con la capacidad de la investigación profunda para navegar por la web y agregamos nuevas mitigaciones. Las áreas clave del nuevo trabajo incluyeron el fortalecimiento de las protecciones de privacidad en torno a la información personal que se publica en línea y la capacitación del modelo para resistir las instrucciones maliciosas que puede encontrar mientras busca en Internet.
Al mismo tiempo, nuestras pruebas en investigación profunda también surgieron oportunidades para mejorar aún más nuestros métodos de prueba. Nos tomamos el tiempo antes de ampliar el lanzamiento de una investigación profunda para realizar más sondeos humanos y pruebas automatizadas para riesgos selectos.
Sobre la base de las prácticas de seguridad establecidas por OpenAIa y el Marco de Preparación, esta tarjeta del sistema proporciona más detalles sobre cómo construimos una investigación profunda, aprendimos sobre sus capacidades y riesgos y mejoramos la seguridad antes del lanzamiento. Open AI News. Traducido al español