Weirre está evolucionando nuestra plataforma para ayudar a los desarrolladores y empresas a construir agentes útiles y confiables.
Hoy, weizre lanza el primer conjunto de bloques de construcción que ayudarán a los desarrolladores y empresas a construir agentes útiles y confiables. Vemos a los agentes como sistemas que realizan tareas de forma independiente en nombre de los usuarios. Durante el último año, weimve introdujo nuevas capacidades de modelo, como razonamiento avanzado, interacciones multimodales y nuevas técnicas de seguridad, que han sentado las bases para que nuestros modelos manejen las complejas tareas de varios pasos requeridas para construir agentes. Sin embargo, los clientes han compartido que convertir estas capacidades en agentes listos para la producción puede ser un desafío, ya que a menudo requiere una amplia iteración rápida y una lógica de orquestación personalizada sin suficiente visibilidad o soporte incorporado.
Para hacer frente a estos desafíos, estamos lanzando un nuevo conjunto de APIs y herramientas específicamente diseñadas para simplificar el desarrollo de aplicaciones agentic:
- El nuevo API Respuestas(se abre en una ventana nueva), combinando la simplicidad de la API de Complementos de Chat con las capacidades de uso de herramientas de la API de Asistentes para agentes de construcción
- Herramientas integradas que incluyen búsqueda web(se abre en una ventana nueva), búsqueda de archivos(se abre en una ventana nueva), y uso de computadora(se abre en una ventana nueva)
- El nuevo Agentes SDK(se abre en una ventana nueva)para orquestar flujos de trabajo de agente único y agente múltiple
- Integrado herramientas de observabilidad(se abre en una ventana nueva)para rastrear e inspeccionar la ejecución del flujo de trabajo del agente
Estas nuevas herramientas agilizan la lógica, la orquestación y las interacciones de los agentes centrales, lo que facilita significativamente que los desarrolladores comiencen con los agentes de construcción. En las próximas semanas y meses, planeamos lanzar herramientas y capacidades adicionales para simplificar y acelerar aún más la creación de aplicaciones agentic en nuestra plataforma.
Presentamos la API de Respuestas
La API de Respuestas es nuestra nueva API primitiva para aprovechar las herramientas integradas de OpenAIays para crear agentes. Combina la simplicidad de Chat Completions con las capacidades de uso de herramientas de la API de Asistentes. A medida que las capacidades del modelo continúan evolucionando, creemos que la API de Respuestas proporcionará una base más flexible para que los desarrolladores creen aplicaciones agentic. Con una sola llamada API de Respuestas, los desarrolladores podrán resolver tareas cada vez más complejas utilizando múltiples herramientas y giros de modelo.
Para comenzar, la API de Respuestas admitirá nuevas herramientas integradas como búsqueda web, búsqueda de archivos y uso de la computadora. Estas herramientas están diseñadas para trabajar juntas para conectar modelos al mundo real, haciéndolos más útiles para completar tareas. También trae consigo varias mejoras de usabilidad que incluyen un diseño unificado basado en elementos, polimorfismo más simple, eventos de transmisión intuitivos y ayudantes de SDK como response.output_text
para acceder fácilmente a la salida de texto de modelizaciones.
La API de Respuestas está diseñada para desarrolladores que desean combinar fácilmente modelos OpenAI y herramientas integradas en sus aplicaciones, sin la complejidad de integrar múltiples API o proveedores externos. La API también facilita el almacenamiento de datos en OpenAI para que los desarrolladores puedan evaluar el rendimiento del agente utilizando características como el rastreo y las evaluaciones. Como recordatorio, nosotros no entrene nuestros modelos sobre datos comerciales de forma predeterminada, incluso cuando los datos se almacenan en OpenAI. La API está disponible para todos los desarrolladores a partir de hoy y no se cobra por separado—tokens y las herramientas se facturan a las tarifas estándar especificadas en nuestro página de precios(se abre en una ventana nueva). Echa un vistazo a la API de Respuestas guía de inicio rápido(se abre en una ventana nueva)para aprender más.
Lo que esto significa para las API existentes
- API de Complementos de Chat(se abre en una ventana nueva): Chat Completions sigue siendo nuestra API más ampliamente adoptada, y estamos totalmente comprometidos a apoyarla con nuevos modelos y capacidades. Los desarrolladores que no requieren herramientas integradas pueden continuar usando Chat Completions con confianza. Weirll seguirá lanzando nuevos modelos a Chat Completions cada vez que sus capacidades no dependan de herramientas integradas o múltiples llamadas de modelos. Sin embargo, la API de Respuestas es una superconjunto(se abre en una ventana nueva)de Complementos de Chat con el mismo gran rendimiento, por lo que para nuevas integraciones, recomendamos comenzar con la API de Respuestas.
- API Asistentes(se abre en una ventana nueva): Basándose en los comentarios de los desarrolladores de la API beta de Assistants, weesove incorporó mejoras clave en la API de Respuestas, haciéndola más flexible, más rápida y más fácil de usar. Weiwre trabaja para lograr la paridad completa de características entre los Asistentes y la API de Respuestas, incluido el soporte para objetos tipo Asistente y tipo Hilo, y la herramienta de Interpretación de Código. Una vez que esto esté completo, planeamos anunciar formalmente la depreciación de la API de Asistentes con una fecha de puesta de sol objetivo a mediados de 2026. Tras la depreciación, proporcionaremos una guía de migración clara desde la API de Asistentes a la API de Respuestas que permite a los desarrolladores preservar todos sus datos y migrar sus aplicaciones. Hasta que anunciemos formalmente la depreciación, continuaremos entregando nuevos modelos a la API de Asistentes. La API de Respuestas representa la dirección futura para los agentes de construcción en OpenAI.
Introducción de herramientas integradas en la API de Respuestas
Búsqueda web
Los desarrolladores ahora pueden obtener respuestas rápidas y actualizadas con citas claras y relevantes de la web. En la API de Respuestas, la búsqueda web está disponible como herramienta cuando se usan gpt-4o y gpt-4o-mini, y se puede emparejar con otras herramientas o llamadas a funciones.
JavaScript
1
const response = await openai.responses.create({
2
model: "gpt-4o",
3
tools: [ { type: "web_search_preview" } ],
4
input: "What was a positive news story that happened today?",
5
});
6
7
console.log(response.output_text);
Durante las primeras pruebas, weiz ha visto a los desarrolladores crear con la búsqueda web una variedad de casos de uso, incluidos asistentes de compras, agentes de investigación y agentes de reservas de viajes, cualquier aplicación que requiera información oportuna de la web.
Por ejemplo, Hebbia(se abre en una ventana nueva)aprovecha la herramienta de búsqueda web para ayudar a los administradores de activos, las empresas de capital privado y crédito, y las prácticas legales a extraer rápidamente información procesable de extensos conjuntos de datos públicos y privados. Al integrar las capacidades de búsqueda en tiempo real en sus flujos de trabajo de investigación, Hebbia ofrece una inteligencia de mercado más rica y específica del contexto y mejora continuamente la precisión y relevancia de sus análisis, superando los puntos de referencia actuales.
La búsqueda web en la API funciona con el mismo modelo utilizado para la búsqueda de ChatGPT. En SimpleQA, un punto de referencia que evalúa la precisión de los LLM al responder preguntas breves y fácticas, la vista previa de búsqueda de GPT‑4o y la vista previa de mini búsqueda de GPT‑4o obtienen un 90% y 88% respectivamente.
SimpleQA Precisión (más alto es mejor)
63%38%47%15%90%88%020406080100AccuracyGPT-4.5GPT-4oOpenAI o1OpenAI o3-miniGPT-4osearch previewGPT-4o minisearch preview
Las respuestas generadas con la búsqueda web en la API incluyen enlaces a fuentes, como artículos de noticias y publicaciones de blog, lo que brinda a los usuarios una forma de obtener más información. Con estas citas claras y en línea, los usuarios pueden interactuar con la información de una nueva manera, mientras que los propietarios de contenido obtienen nuevas oportunidades para llegar a un público más amplio.
Cualquier sitio web o editor puede elige aparecer(se abre en una ventana nueva)en la búsqueda web en la API.
La herramienta de búsqueda web está disponible para todos los desarrolladores en vista previa en la API de Respuestas. También estamos brindando a los desarrolladores acceso directo a nuestros modelos de búsqueda ajustados en la API de Complementos de Chat a través de gpt-4o-search-preview
y gpt-4o-mini-search-preview
. Precios(se abre en una ventana nueva) comienza respectivamente en $30 y $25 por mil consultas para la búsqueda de GPT‑4o y la búsqueda de 4o-mini respectivamente. Echa un vistazo a la búsqueda web en el Zona de juegos(se abre en una ventana nueva) y aprende más en nuestro documentos(se abre en una ventana nueva).
Búsqueda de archivos
Los desarrolladores ahora pueden recuperar fácilmente información relevante de grandes volúmenes de documentos utilizando la herramienta de búsqueda de archivos mejorada. Con soporte para múltiples tipos de archivos, optimización de consultas, filtrado de metadatos y reclasificación personalizada, puede ofrecer resultados de búsqueda rápidos y precisos. Y nuevamente, con la API de Respuestas, solo se necesitan unas pocas líneas de código para integrarse.
JavaScript
1
const productDocs = await openai.vectorStores.create({
2
name: "Product Documentation",
3
file_ids: [file1.id, file2.id, file3.id],
4
});
5
6
const response = await openai.responses.create({
7
model: "gpt-4o-mini",
8
tools: [{
9
type: "file_search",
10
vector_store_ids: [productDocs.id],
11
}],
12
input: "What is deep research by OpenAI?",
13
});
14
15
console.log(response.output_text);
La herramienta de búsqueda de archivos se puede utilizar para una variedad de casos de uso en el mundo real, lo que incluye permitir que un agente de atención al cliente acceda fácilmente a las Preguntas Frecuentes, ayudar a un asistente legal a hacer referencia rápidamente a casos anteriores para un profesional calificado y ayudar a un agente de codificación a consultar documentación técnica. Por ejemplo, Navan(se abre en una ventana nueva)utiliza la búsqueda de archivos en su agente de viajes impulsado por IA para proporcionar rápidamente a sus usuarios respuestas precisas de artículos de base de conocimiento (como la política de viajes de sus compañías). Con la optimización y reclasificación de consultas integradas, pueden configurar una potente tubería RAG (generación aumentada por recuperación) sin ajuste o configuración adicional. Con almacenes vectoriales dedicados para cada grupo de usuarios, Navan puede adaptar las respuestas a la configuración de la cuenta individual y los roles de usuario, ahorrando tiempo para los clientes y su personal al tiempo que ayuda a proporcionar un soporte preciso y personalizado.
Esta herramienta está disponible en la API de Respuestas para todos los desarrolladores. El uso es precio(se abre en una ventana nueva) en $2.50 por mil consultas y almacenamiento de archivos en $0.10/GB/día, con el primer GB gratis. La herramienta sigue estando disponible en la API de Asistentes. Por último, weizve también agregó un nuevo punto final de búsqueda a los objetos de la API de Vector Store para consultar directamente sus datos para usarlos en otras aplicaciones y API. Obtenga más información en nuestro documentos(se abre en una ventana nueva) y empezar a probar en el Zona de juegos(se abre en una ventana nueva).
Uso de computadora
Para crear agentes capaces de completar tareas en una computadora, los desarrolladores ahora pueden usar la herramienta de uso de la computadora en la API de Respuestas, impulsada por la misma Modelo de Agente de Uso de Computadora (CUA) eso permite Operador. Este modelo de vista previa de investigación estableció un nuevo récord de vanguardia, logrando un éxito del 38.1% OSWorld(se abre en una ventana nueva) para tareas de uso completo de la computadora, 58.1% en WebArena(se abre en una ventana nueva)87% en WebVoyager(se abre en una ventana nueva)para interacciones basadas en la web.
La herramienta de uso de computadora incorporada captura las acciones del mouse y el teclado generadas por el modelo, lo que hace posible que los desarrolladores automaticen las tareas de uso de la computadora traduciendo directamente estas acciones en comandos ejecutables dentro de sus entornos.
JavaScript
1
const response = await openai.responses.create({
2
model: "computer-use-preview",
3
tools: [{
4
type: "computer_use_preview",
5
display_width: 1024,
6
display_height: 768,
7
environment: "browser",
8
}],
9
truncation: "auto",
10
input: "I'm looking for a new camera. Help me find the best one.",
11
});
12
13
console.log(response.output);
Los desarrolladores pueden usar la herramienta de uso de la computadora para automatizar los flujos de trabajo basados en el navegador, como realizar garantías de calidad en aplicaciones web o ejecutar tareas de entrada de datos en sistemas heredados. Por ejemplo, Unificar(se abre en una ventana nueva)es un sistema de acción para aumentar los ingresos que utiliza agentes para identificar intenciones, investigar cuentas e interactuar con los compradores. Usando la herramienta de uso de computadoras OpenAIays, los agentes de Unifyifiests pueden acceder a información que antes era inalcanzable a través de APIs—, como permitir que una compañía de administración de propiedades verifique a través de mapas en línea si una empresa ha ampliado su huella inmobiliaria. Esta investigación actúa como una señal personalizada para activar el alcance personalizado, impulsando a los equipos de lanzamiento al mercado para involucrar a los compradores con precisión y escala.
Como otro ejemplo, Luminai(se abre en una ventana nueva)integró la herramienta de uso de la computadora para automatizar flujos de trabajo operativos complejos para grandes empresas con sistemas heredados que carecen de disponibilidad de API y datos estandarizados. En un piloto reciente con una importante organización de servicio comunitario, Luminai automatizó el proceso de procesamiento de aplicaciones y el proceso de inscripción de usuarios en solo unos días, algo que la automatización de procesos robóticos tradicionales (RPA) luchó por lograr después de meses de esfuerzo.
Antes de lanzar CUA en Operator el año pasado, realizamos extensas pruebas de seguridad y equipo rojo, abordando tres áreas clave de riesgo: mal uso, errores de modelo y riesgos fronterizos. Para abordar los riesgos asociados con la expansión de las capacidades de los Operadores a los sistemas operativos locales a través de CUA en la API, realizamos evaluaciones de seguridad adicionales y trabajo en equipo rojo. También agregamos mitigaciones para los desarrolladores, incluidas comprobaciones de seguridad para protegerse contra inyecciones rápidas, solicitudes de confirmación para tareas sensibles, herramientas para ayudar a los desarrolladores a aislar sus entornos y una mejor detección de posibles violaciones de políticas. Si bien estas mitigaciones ayudan a reducir el riesgo, el modelo sigue siendo susceptible a errores involuntarios, especialmente en entornos que no son de navegador. Por ejemplo, el rendimiento de CUAa en OSWorld,un punto de referencia diseñado para medir el rendimiento de los agentes de IA en tareas del mundo real, se encuentra actualmente en 38.1%, lo que indica que el modelo aún no es altamente confiable para automatizar tareas en sistemas operativos. Se recomienda la supervisión humana en estos escenarios. Más detalles sobre nuestro trabajo de seguridad específico de API se pueden encontrar en nuestra actualización tarjeta del sistema.
Tipo de referencia | Benchmark | Uso de la computadora (interfaz universal) | Agentes de navegación web | Humano | |
---|---|---|---|---|---|
CUA OpenAI | Anterior SOTA | Anterior SOTA | |||
Uso de computadora | OSWorld | 38,1% | 22,0% | – | 72,4% |
Uso del navegador | WebArena | 58,1% | 36,2% | 57,1% | 78,2% |
WebVoyager | 87,0% | 56,0% | 87,0% | – |
Se describen los detalles de la evaluación
A partir de hoy, la herramienta de uso de la computadora está disponible como una vista previa de investigación en la API de Respuestas para desarrolladores seleccionados en niveles de uso 3-5(se abre en una ventana nueva). El uso es precio(se abre en una ventana nueva) en $tokens de entrada de 3/1M y $tokens de salida de 12/1M. Obtenga más información en nuestro documentos(se abre en una ventana nueva) y mira el aplicación de muestra(se abre en una ventana nueva)ilustrando cómo construir con esta herramienta.
Agentes SDK
Además de construir la lógica central de los agentes y darles acceso a las herramientas para que sean útiles, los desarrolladores también necesitan orquestar flujos de trabajo agentic. Nuestro nuevo SDK de Agentes de código abierto simplifica la orquestación de flujos de trabajo de múltiples agentes y ofrece mejoras significativas sobre Enjambre(se abre en una ventana nueva), un SDK experimental que lanzamos el año pasado que fue ampliamente adoptado por la comunidad de desarrolladores e implementado con éxito por múltiples clientes.
Las mejoras incluyen:
- Agentes: LLM fácilmente configurables con instrucciones claras y herramientas integradas.
- Entrega: Control de transferencia inteligente entre agentes.
- Guardabarros: Verificaciones de seguridad configurables para la validación de entrada y salida.
- Rastreo y Observabilidad: Visualiza los rastros de ejecución del agente para depurar y optimizar el rendimiento.
Python
1
from agents import Agent, Runner, WebSearchTool, function_tool, guardrail
2
3
@function_tool
4
defsubmit_refund_request(item_id: str, reason: str):
5
# Your refund logic goes here
6
return"success"
7
8
support_agent = Agent(
9
name="Support & Returns",
10
instructions="You are a support agent who can submit refunds [...]",
11
tools=[submit_refund_request],
12
)
13
14
shopping_agent = Agent(
15
name="Shopping Assistant",
16
instructions="You are a shopping assistant who can search the web [...]",
17
tools=[WebSearchTool()],
18
)
19
20
triage_agent = Agent(
21
name="Triage Agent",
22
instructions="Route the user to the correct agent.",
23
handoffs=[shopping_agent, support_agent],
24
)
25
26
output = Runner.run_sync(
27
starting_agent=triage_agent,
28
input="What shoes might work best with my outfit so far?",
29
)
El SDK de Agents es adecuado para diversas aplicaciones del mundo real, incluida la automatización de atención al cliente, la investigación en varios pasos, la generación de contenido, la revisión de código y la prospección de ventas. Por ejemplo, Coinbase(se abre en una ventana nueva)utilizó el SDK de Agents para crear prototipos e implementar AgentKit rápidamente, un kit de herramientas que permite a los agentes de IA interactuar sin problemas con las billeteras criptográficas y varias actividades en la cadena. En solo unas horas, Coinbase integró acciones personalizadas de su SDK de Developer Platform en un agente completamente funcional. La arquitectura optimizada de AgentKitits simplificó el proceso de agregar nuevas acciones de agente, permitiendo a los desarrolladores centrarse más en integraciones significativas y menos en navegar por configuraciones complejas de agentes.
En un par de días, Caja(se abre en una ventana nueva)fue capaz de crear rápidamente agentes que aprovechan la búsqueda web y el SDK de Agents para permitir a las empresas buscar, consultar y extraer información de datos no estructurados almacenados en Box y fuentes públicas de Internet. Este enfoque permite a los clientes no solo acceder a la información más reciente, sino también buscar sus datos internos y propietarios de una manera segura que obedezca sus permisos internos y políticas de seguridad. Por ejemplo, una empresa de servicios financieros puede crear un agente personalizado que pida al agente de Box AI que integre su análisis del mercado interno almacenado en Box con noticias en tiempo real y datos económicos de la web, proporcionando a sus analistas una visión integral de las decisiones de inversión.
El SDK de Agents funciona con la API de Respuestas y la API de Complementos de Chat. El SDK también funcionará con modelos de otros proveedores, siempre que proporcionen un punto final de API de estilo de Complementos de Chat. Los desarrolladores pueden integrarlo inmediatamente en sus bases de código Python, con el soporte de Node.js próximamente. Obtenga más información en nuestro documentos(se abre en una ventana nueva).
Al diseñar el SDK de Agents, nuestro equipo se inspiró en el excelente trabajo de otros en la comunidad, incluyendo Pidántico(se abre en una ventana nueva), Grifo(se abre en una ventana nueva) y MkDocs(se abre en una ventana nueva). Weirre se comprometió a continuar construyendo el SDK de Agents como un marco de código abierto para que otros en la comunidad puedan ampliar nuestro enfoque.
Lo que sigue: construir la plataforma para los agentes
Creemos que los agentes pronto se convertirán en parte integral de la fuerza laboral, mejorando significativamente la productividad en todas las industrias. A medida que las empresas buscan cada vez más aprovechar la IA para tareas complejas, nos comprometemos a proporcionar los componentes básicos que permiten a los desarrolladores y las empresas crear sistemas autónomos que generen un impacto real.
Con los lanzamientos actuales, weir está introduciendo los primeros bloques de construcción para capacitar a los desarrolladores y empresas para construir, implementar y escalar más fácilmente agentes de IA confiables y de alto rendimiento. A medida que las capacidades del modelo se vuelven cada vez más agentic, weizll continuará invirtiendo en integraciones más profundas en nuestras API y nuevas herramientas para ayudar a implementar, evaluar y optimizar los agentes en la producción. Nuestro objetivo es brindar a los desarrolladores una experiencia de plataforma perfecta para los agentes de construcción que pueden ayudar con una variedad de tareas en cualquier industria. Estamos emocionados de ver qué construyen los desarrolladores a continuación. Para empezar, explora nuestro documentos(se abre en una ventana nueva)y estén atentos para más actualizaciones pronto.