Cuando introdujimos la generación de imágenes en ChatGPT el mes pasado, rápidamente se convirtió en una de nuestras características más populares: más de 130 millones de usuarios en todo el mundo crearon más de 700 millones de imágenes en solo el primera semana .
Hoy, incorporamos el modelo multimodal nativo que impulsa esta experiencia en ChatGPT a la API mediante [API] gpt-image-1
. Esto permite a desarrolladores y empresas integrar fácilmente la generación de imágenes de alta calidad y nivel profesional directamente en sus propias herramientas y plataformas. La versatilidad del modelo permite crear imágenes con diversos estilos, seguir fielmente las directrices personalizadas, aprovechar el conocimiento del mundo y renderizar texto con precisión, lo que abre innumerables aplicaciones prácticas en múltiples dominios.
Empresas y startups líderes de diversos sectores, como herramientas creativas, comercio electrónico, educación, software empresarial y videojuegos, ya utilizan la generación de imágenes en sus productos y experiencias. Nos complace compartir algunos ejemplos a continuación.AdobeMesa de aireFigmaGamaHeyGenClip de opciónQuoraWixSala de fotografíaPatio de juegos
El ecosistema líder de herramientas creativas de Adobe , incluidas sus aplicaciones Firefly y Express, brindará acceso a las capacidades de generación de imágenes de OpenAI, lo que dará a los creadores la opción y la flexibilidad de experimentar con diferentes estilos estéticos, algo que los profesionales de negocios, los consumidores y los creadores valoran al generar nuevas ideas creativas.
Airtable está impulsando la producción creativa con IA en flujos de trabajo escalables para ayudar a los equipos a aprovechar al máximo las campañas gestionadas en el producto. Con las capacidades de generación de imágenes de OpenAI, Airtable ahora permite …(se abre en una nueva ventana)Los equipos creativos y de marketing empresarial pueden gestionar fácilmente los flujos de trabajo de recursos a gran escala, desde la generación de conceptos de campaña hasta la remezcla de recursos y la localización de medios para mercados internacionales. Por ejemplo, una empresa de ropa ahora puede generar docenas de conceptos de campaña, producir recursos según la disponibilidad regional y localizarlos, todo con solo unos clics.
Figma aprovecha el último modelo para incorporar funciones avanzadas de generación y edición de imágenes en toda su plataforma. A partir de hoy, los usuarios pueden usar gpt-image-1
Figma Design para generar y editar imágenes con solo unas pocas indicaciones: ajustar estilos, añadir o eliminar objetos, ampliar fondos y mucho más. Esta nueva integración permite a los diseñadores explorar ideas rápidamente e iterar visualmente, todo en Figma.
Gamma genera más de 5 millones de imágenes de IA a diario para ayudar a los usuarios a ilustrar presentaciones y sitios web. Gamma utiliza estas herramientas gpt-image-1
para generar diagramas y visualizaciones detalladas, editar el contenido de imágenes existentes y rediseñarlas para lograr una apariencia uniforme.

HeyGen se integra gpt-image-1
para optimizar la creación de avatares, en particular la edición dentro de la plataforma. Esta integración permite a los usuarios personalizar la apariencia de los avatares con mayor flexibilidad y control creativo, ofreciendo una experiencia de avatar más personalizada.

OpusClip Thumbnail es un generador de miniaturas con IA de un solo clic. Aprovechando el último modelo de OpenAI, gpt-image-1
OpusClip Thumbnail ayuda a más de 10 millones de creadores de YouTube a generar miniaturas personalizadas, atractivas y optimizadas para un rendimiento óptimo que se adaptan perfectamente al contenido y los títulos de sus videos.
Quora está creando su nuevo modelo de imagen predeterminado, elevando el estándar de calidad de generación de imágenes y la pronta adhesión para millones de sus usuarios y la creciente comunidad de creadores en su plataforma.gpt-image-1
Wix ha integrado la generación de imágenes en Wixel .(se abre en una nueva ventana)Su plataforma de diseño con IA facilita que cualquiera convierta sus ideas en diseños profesionales. Con ajustes preestablecidos para el tamaño de la imagen, el estilo, el ángulo de la cámara y el tipo de toma, los usuarios pueden ajustar fácilmente sus indicaciones y luego editarlas según sea necesario, reemplazando o eliminando objetos, añadiendo filtros y más para lograr el aspecto deseado.
Photoroom utiliza gpt-image-1
tres nuevas herramientas de IA: Product Beautifier, Product Staging y Virtual Model, que ayudan a los vendedores online a crear al instante imágenes con calidad de estudio, escenas de estilo de vida y fotos de modelos a partir de una sola foto de producto. Estas herramientas facilitan enormemente la creación de contenido de alta conversión a gran escala para emprendedores y pequeñas empresas.
Playground ofrece a sus usuarios mayor libertad para realizar ediciones aún más potentes en sus diseños gracias a las capacidades de generación de imágenes de OpenAI. Como resultado, pueden cambiar estilos, colores e incorporar diseños en maquetas con mayor fidelidad a su visión creativa.
También seguimos trabajando con desarrolladores y empresas para descubrir más formas en las que la generación de imágenes en la API puede servir a sus casos de uso, entre ellas:
Diseño y edición: Canva explora maneras de integrar OpenAI gpt-image-1
para ampliar los límites de la generación y edición de diseños en sus herramientas Canva AI y Magic Studio. Mediante gpt-image-1
capacidades como la transformación de bocetos en impresionantes elementos gráficos y la posibilidad de ediciones visuales de alta fidelidad, Canva permitirá a sus 230 millones de usuarios dar vida a sus ideas de formas completamente nuevas.
Creación y edición de logotipos: GoDaddy está experimentando activamente para integrar la generación de imágenes, lo que permite a los clientes crear fácilmente logotipos editables, eliminar fondos y generar tipografía profesional. Además, como nueva experiencia con GoDaddy Airo®, el equipo trabaja para que los clientes creen publicaciones en redes sociales y recursos de marketing que reflejen la identidad única de su marca, creando contenido original de producto y marca a partir de una solicitud.
Creación de materiales de marketing: HubSpot explora cómo las nuevas capacidades de generación de imágenes con IA de OpenAI pueden ayudar a los clientes a crear materiales de marketing y ventas. A medida que HubSpot continúa incorporando nuevas herramientas basadas en IA para el crecimiento de las empresas, estas capacidades de generación de imágenes tienen el potencial de transformar la forma en que los clientes producen imágenes de alta calidad para redes sociales, email marketing y landing pages sin necesidad de conocimientos especializados de diseño.
Generación de recetas y listas de compras: Instacart está probando nuevas formas de utilizar la API para la generación de imágenes, incluidas imágenes para recetas y listas de compras.
Edición de videos: InVideo permite a millones de usuarios transformar sus ideas en videos mediante IA. Con la integración de [Insert gpt-image-1
], la plataforma ofrece generación de texto mejorada, controles de edición precisos y guía de estilo avanzada.
Seguridad
El modelo de la API utiliza las mismas medidas de seguridad que la generación de imágenes 4o en ChatGPT, incluyendo medidas que impiden que el modelo genere imágenes dañinas y la inclusión de metadatos de C2PA en las imágenes generadas. Puede leer más sobre esto en nuestra publicación anterior del blog aquí . Además, los desarrolladores pueden controlar la sensibilidad de moderación con el parámetro `moderation`, que puede configurarse como automático (predeterminado) para un filtrado estándar o bajo para un filtrado menos restrictivo. Obtenga más información en nuestra documentación .gpt-image-1
(se abre en una nueva ventana).
De forma predeterminada, nunca realizamos entrenamiento con datos de API de clientes, y todas las entradas y salidas de imágenes siguen sujetas a nuestras políticas de uso de API.
Precios
El uso gpt-image-1
tiene un precio por token, con precios separados para tokens de texto e imagen:
- Tokens de entrada de texto (texto de solicitud): $5 por 1 millón de tokens
- Tokens de entrada de imagen (imágenes de entrada): $10 por 1 millón de tokens
- Tokens de salida de imagen (imágenes generadas): $40 por 1 millón de tokens
En la práctica, esto se traduce en aproximadamente $0.02, $0.07 y $0.19 por imagen generada para imágenes cuadradas de baja, media y alta calidad, respectivamente. Para consultar los precios detallados por calidad y tamaño de imagen, consulte la documentación .(se abre en una nueva ventana).
Empezar
El gpt-image-1
modelo ya está disponible globalmente a través de la API de Imágenes, y próximamente será compatible con la API de Respuestas. Es posible que algunos desarrolladores deban verificarlo .(se abre en una nueva ventana)Su organización antes de poder usar el modelo. Por favor, revise la configuración de la organización .(se abre en una nueva ventana)para ver si ya tienes acceso.
Para comenzar, explora las capacidades del modelo en el área de juegos .(se abre en una nueva ventana)y consulta nuestra guía de generación de imágenes (se abre en una nueva ventana)Esperamos ver lo que construyas. OpenAI News. Traducido al español