OpenAI está orquestando un despliegue muy gradual de GPT-4o, incluidas sus capacidades multimodales.
GPT-4o, ¿más rápido que GPT-4 Turbo para generar texto? OpenAI lo afirma… y varios comentarios lo confirman .
Los usuarios parecen más divididos en cuanto al rendimiento. OpenAI anuncia un equivalente potencial al de GPT-4 Turbo para texto, razonamiento y código. Asegura que GPT-4o es mejor en otros idiomas además del inglés. Lo mismo ocurre con la visión –que las pruebas validan– y con el audio.
GPT-4o, una versión restringida en el lanzamiento
Para experimentar esta última característica, tendrás que esperar. Lo mismo ocurre con el vídeo “en tiempo real”: por el momento hay que dividirlo en secuencias de imágenes. OpenAI cree que todavía necesita trabajar* en infraestructura, sobreentrenamiento y seguridad. El tiempo de entrega debe medirse en meses. Mientras tanto, comenzará una prueba de estas modalidades en un círculo restringido (versión alfa) en ChatGPT Plus y en la API.
GPT-4o solo está disponible en ChatGPT Plus. También está disponible en el plan Team, estará disponible “pronto” en la edición Enterprise… y también está disponible en la versión gratuita. A nivel de API, se encuentra en los puntos finales de finalización de chat, asistentes y lotes . OpenAI también brinda acceso a él en su área de juegos . Como Microsoft en términos de la oferta del servicio Azure OpenAI (en la región de la nube de EE. UU.).
GPT-4o, también en ChatGPT Gratis
La base de conocimientos del GPT-4o finaliza en octubre de 2023. Es decir, antes que la del GPT-4 Turbo (diciembre de 2023). La ventana de contexto es la misma (128k; salida máxima de 4k). La inferencia, por otro lado, cuesta la mitad ($5 por millón de tokens en entrada; $15 en producción). Y los límites de rendimiento son más altos en ChatGPT (x 5, a 10 millones de tokens por minuto**) que en la API (de 30k TPM y 500 RPM en el nivel 1 a 5M TPM y 10k RPM en el nivel 5).
GPT-4o también utiliza una nueva versión del codificador TikTok. Esto optimiza la producción de texto, particularmente en idiomas orientales (hay ejemplos de -25% de tokens en japonés).
En las versiones pagas de ChatGPT, los GPT todavía usan GPT-4. OpenAI planea integrar GPT-4o «en las próximas semanas».
En la versión gratuita, agotar la cuota de GPT-4o también impedirá el uso de GPT. Limitaciones de navegación, análisis de datos y carga de archivos están separados… pero compartidos entre ellos.
Funciones específicas para el análisis de datos.
Aunque está cerca de GPT-4 Turbo en términos de rendimiento, GPT-4o es actualmente el único que admite las últimas capacidades agregadas al bloque de Análisis de datos avanzado (anteriormente Code Interpreter). Esto permite a ChatGPT realizar operaciones como:
– Detección y corrección de anomalías (valores faltantes o fuera de rango, líneas duplicadas, tipos de datos incorrectos, etc.)
– Agregación/integración (sumas, promedios, desviaciones estándar, fusión de identificadores compartidos, etc.)
– Estadísticas comparativas, correlación/ regresión y series de tiempo
El análisis de datos avanzado también puede crear tablas y gráficos (usa pandas y Matplotlib). Los gráficos de líneas y barras, como los gráficos circulares y los diagramas de dispersión, son la mayoría de las veces interactivos… siempre que utilice GPT-4o. También necesitarás usar este modelo para aprovechar la vista expandible (interfaz de pantalla completa, la discusión pasa a un panel lateral) y la importación de archivos desde Google Drive y OneDrive.
* El modo de voz de GPT-3.5 y GPT-4 implica distintos modelos de reconocimiento y síntesis de voz, intercalados antes y después del LLM. Por lo tanto, al procesar esta última una transcripción, perdemos elementos como el tono, el entorno sonoro y la identificación de los hablantes. Con GPT-4o, una única red neuronal procesará todo tipo de contenidos y, por tanto, de forma más coherente.
** Estos límites se aplican a la cantidad de tokens . No para el volumen de mensajes. En el lanzamiento, el límite para GPT-4o era de 80 mensajes cada tres horas en ChatGPT Plus. Contra 40 con GPT-4. NetMedia, Francia.CB.Traducido al español
Foto de ilustración © maciek905 – Adobe Stock