ChatGPT ahora piensa y actúa, eligiendo de manera proactiva entre una caja de herramientas de habilidades de agencia para completar tareas para usted usando su propia computadora. ChatGPT ahora puede trabajar por usted usando su propia computadora, manejando tareas complejas de principio a fin. Ahora puedes pedirle a ChatGPT que gestione solicitudes como «Consultar mi calendario e informarme sobre las próximas reuniones con clientes según las noticias recientes», «Planificar y comprar ingredientes para preparar un desayuno japonés para cuatro» y «Analizar a tres competidores y crear una presentación». ChatGPT navegará inteligentemente por sitios web, filtrará resultados, te solicitará que inicies sesión de forma segura cuando sea necesario, ejecutará código, realizará análisis e incluso te entregará presentaciones y hojas de cálculo editables que resumen sus hallazgos. En el centro de esta nueva capacidad se encuentra un sistema de agencia unificado. Este sistema aúna tres puntos fuertes de innovaciones anteriores: la capacidad del operador para interactuar con sitios web, la capacidad de la investigación profunda para sintetizar información, y la inteligencia y fluidez conversacional de ChatGPT. ChatGPT lleva a cabo estas tareas utilizando su propia computadora virtual, cambiando fluidamente entre el razonamiento y la acción para manejar flujos de trabajo complejos de principio a fin, todo basado en sus instrucciones. Lo más importante es que siempre tienes el control. ChatGPT solicita permiso antes de realizar acciones importantes, y puedes interrumpir, tomar el control del navegador o detener tareas fácilmente en cualquier momento. A partir de hoy, los usuarios Pro, Plus y Team pueden activar las nuevas capacidades de agente de ChatGPT directamente a través del menú desplegable de herramientas del compositor, seleccionando «modo agente» en cualquier momento de cualquier conversación. Si bien el agente ChatGPT ya es una herramienta potente para gestionar tareas complejas, el lanzamiento de hoy es solo el comienzo. Seguiremos incorporando mejoras significativas de forma iterativa y regular, haciéndolo más eficaz y útil para más personas con el tiempo. Una evolución natural del Operador y una investigación profunda Anteriormente, Operator y la investigación profunda ofrecían ventajas únicas: Operator podía navegar, hacer clic y escribir en la web, mientras que la investigación profunda destacaba en el análisis y resumen de información. Sin embargo, funcionaban mejor en situaciones diferentes: Operator no podía profundizar en el análisis ni generar informes detallados, y la investigación profunda no podía interactuar con sitios web para refinar resultados ni acceder a contenido que requiriera autenticación del usuario. De hecho, observamos que muchas consultas que los usuarios intentaban con Operator eran más adecuadas para la investigación profunda, así que combinamos lo mejor de ambas. Al integrar estas fortalezas complementarias en ChatGPT e incorporar herramientas adicionales, hemos desbloqueado capacidades completamente nuevas en un solo modelo. Ahora puede interactuar activamente con los sitios web: haciendo clic, filtrando y obteniendo resultados más precisos y eficientes. También puede pasar de una simple conversación a solicitar acciones directamente desde el mismo chat. 00:00 01:54 00:00 00:00 00:00 00:00 00:00 00:00 Un agente que trabaja para ti, contigo Hemos equipado al agente de ChatGPT con un conjunto de herramientas: un navegador visual que interactúa con la web mediante una interfaz gráfica de usuario, un navegador de texto para consultas web más sencillas basadas en razonamiento, una terminal y acceso directo a la API. El agente también puede aprovechar los conectores de ChatGPT .(se abre en una nueva ventana), que permite conectar aplicaciones como Gmail y Github para que ChatGPT encuentre información relevante para tus indicaciones y la use en sus respuestas. También puedes iniciar sesión en cualquier sitio web controlando el navegador, lo que le permite profundizar y ampliar su búsqueda y ejecución de tareas. Al ofrecer a ChatGPT estas diferentes vías para acceder e interactuar con la información web, puede elegir la ruta óptima para realizar tareas de la forma más eficiente. Por ejemplo, puede recopilar información sobre tu calendario mediante una API, analizar grandes cantidades de texto de forma eficiente mediante el navegador basado en texto y, al mismo tiempo, interactuar visualmente con sitios web diseñados principalmente para usuarios. Todo esto se realiza mediante su propia computadora virtual, que conserva el contexto necesario para la tarea, incluso al usar varias herramientas: el modelo puede abrir una página con el navegador de texto o visual, descargar un archivo de la web, manipularlo ejecutando un comando en la terminal y luego visualizar el resultado en el navegador visual. El modelo adapta su enfoque para realizar tareas con rapidez, precisión y eficiencia. El agente ChatGPT está diseñado para flujos de trabajo iterativos y colaborativos, y es mucho más interactivo y flexible que los modelos anteriores. Durante el funcionamiento de ChatGPT, puedes interrumpirlo en cualquier momento para aclarar tus instrucciones, orientarlo hacia los resultados deseados o modificar la tarea por completo. Reanudará la tarea donde la dejaste, ahora con la nueva información, pero sin perder el progreso previo. Asimismo, ChatGPT puede solicitarte información adicional de forma proactiva cuando sea necesario para garantizar que la tarea se mantenga alineada con tus objetivos. Si una tarea tarda más de lo previsto o parece atascada, puedes pausarla, solicitar un resumen del progreso o detenerla por completo y recibir resultados parciales. Si tienes la app ChatGPT en tu teléfono, te enviará una notificación cuando haya terminado la tarea. Ampliando la utilidad en el mundo real Estas capacidades unificadas de agencia mejoran significativamente la utilidad de ChatGPT tanto en el día a día como en el profesional. En el trabajo, puede automatizar tareas repetitivas, como convertir capturas de pantalla o paneles en presentaciones compuestas de elementos vectoriales editables, reorganizar reuniones, planificar y reservar actividades fuera de la oficina y actualizar hojas de cálculo con nuevos datos financieros, manteniendo el mismo formato. En su vida personal, puede usarlo para planificar y reservar fácilmente itinerarios de viaje, diseñar y reservar cenas completas, o encontrar especialistas y programar citas. Las capacidades elevadas del modelo se reflejan en su desempeño de última generación (SOTA) en evaluaciones que miden la navegación web y las capacidades de finalización de tareas en el mundo real. Sobre el último examen de la humanidad(se abre en una nueva ventana)*, una evaluación que mide