PUNTOS IMPORTANTES:
- OpenAI lanza GPT-4o, más rápido y eficiente, junto con una versión de escritorio de ChatGPT.
- El modelo GPT-4o puede manejar 50 idiomas y tiene capacidades avanzadas en texto, video y audio.
- El lanzamiento se enfoca en mejorar la facilidad de uso y se implementará primero para los suscriptores pagos y luego para los usuarios gratuitos.
OpenAI lanzó el lunes un nuevo modelo de IA y la versión de escritorio de ChatGPT, junto con una interfaz de usuario actualizada, el último esfuerzo de la empresa para expandir el uso de su popular chatbot.
El nuevo modelo, GPT-4o, estará disponible para todos, incluidos los usuarios gratuitos de OpenAI, dijo la directora de tecnología, Mira Murati, en un evento transmitido en vivo. Añadió que el nuevo modelo, GPT-4o, es “mucho más rápido”, con capacidades mejoradas en texto, video y audio. OpenAI dijo que eventualmente planea permitir a los usuarios realizar videollamadas con ChatGPT.
“Esta es la primera vez que realmente damos un gran paso adelante en cuanto a la facilidad de uso”.
Murati.
OpenAI, respaldada por Microsoft, ha sido valorada por más de 80.000 millones de dólares por los inversionistas. La empresa, fundada en 2015, está bajo presión para mantenerse en la cima del mercado de IA generativa mientras busca formas de ganar dinero, ya que gasta sumas masivas en procesadores e infraestructura para construir y entrenar sus modelos.
Características del nuevo modelo GPT-4o
La «o» en GPT-4o significa omni. El nuevo modelo permite a ChatGPT manejar 50 idiomas diferentes con mejor velocidad y calidad, y también estará disponible a través de la API de OpenAI, lo que permite a los desarrolladores comenzar a construir aplicaciones utilizando el nuevo modelo hoy mismo, dijo Murati.
GPT-4o es el doble de rápido y la mitad del costo de GPT-4 Turbo. Los miembros del equipo de OpenAI demostraron las capacidades de audio del nuevo modelo, por ejemplo, pidiéndole que ayudara a calmar a alguien antes de un discurso público. El investigador de OpenAI, Mark Chen, dijo que el modelo es capaz de “percibir tu emoción”, añadiendo que el modelo también puede manejar interrupciones de los usuarios. El equipo también le pidió que analizara la expresión facial de un usuario para comentar sobre las emociones que la persona podría estar experimentando.
“Hola, ¿qué tal? ¿Cómo puedo alegrarte el día hoy?” dijo el modo de audio de ChatGPT cuando un usuario lo saludó.
Planes futuros y capacidades adicionales
La empresa planea probar el Modo de Voz en las próximas semanas, con acceso temprano para suscriptores de pago de ChatGPT Plus, según una publicación en el blog. OpenAI también dijo que el nuevo modelo puede responder a las indicaciones de audio de los usuarios “en tan solo 232 milisegundos, con un promedio de 320 milisegundos, que es similar al tiempo de respuesta humano en una conversación”.
Chen demostró la capacidad del modelo para contar una historia antes de dormir y le pidió que cambiara el tono de su voz para ser más dramático o robótico. Incluso le pidió que cantara la historia.
Además, el nuevo modelo de OpenAI puede funcionar como traductor, incluso en modo de audio, dijo la empresa. Chen demostró la capacidad de la herramienta para escuchar a Murati hablando italiano mientras él hablaba inglés y traducir a sus respectivos idiomas mientras conversaban.
Los miembros del equipo también demostraron la capacidad del modelo para resolver ecuaciones matemáticas y ayudar a escribir código, posicionándolo como un competidor más fuerte para el propio GitHub Copilot de Microsoft.
Impacto y expectativas
Para OpenAI, el lanzamiento fue uno de los anuncios más importantes de la empresa desde el lanzamiento en agosto de ChatGPT Enterprise, el nivel empresarial del chatbot de IA. Esa herramienta estuvo en desarrollo durante “menos de un año” y contó con la ayuda de más de 20 empresas de diferentes tamaños e industrias, dijo a CNBC el director de operaciones de OpenAI, Brad Lightcap, en ese momento.
OpenAI, Microsoft y Google están a la cabeza de una fiebre del oro de IA generativa, ya que empresas de aparentemente todas las industrias corren para agregar chatbots y agentes impulsados por IA a servicios clave para evitar quedarse atrás de los competidores. A principios de este mes, el rival de OpenAI, Anthropic, anunció su primera oferta empresarial y una aplicación gratuita para iPhone.
Inversiones y preocupaciones en la industria de IA
En 2023 se invirtieron 29.100 millones de dólares en casi 700 acuerdos de IA generativa, un aumento de más del 260% respecto al año anterior, según PitchBook. Se predice que el mercado superará los 1 billón de dólares en ingresos dentro de una década.
Algunos en la industria han expresado preocupaciones sobre la velocidad a la que están llegando al mercado nuevos servicios no probados, y académicos y éticos están preocupados por la tendencia de la tecnología a propagar sesgos.
Después del lanzamiento de ChatGPT en noviembre de 2022, rompió récords en ese momento como la aplicación de consumo de más rápido crecimiento en la historia y ahora cuenta con aproximadamente 100 millones de usuarios activos semanales. OpenAI dice que más del 92% de las empresas Fortune 500 están utilizando la plataforma.
Plan de despliegue y agradecimientos
Murati dijo durante el evento del lunes que OpenAI quiere “eliminar parte del misticismo de la tecnología”.
“En las próximas semanas, implementaremos estas capacidades para todos”.
El nuevo modelo se lanzará primero el martes para los clientes de ChatGPT Plus y Team, y luego para Enterprise más adelante, según una publicación en el blog del lunes. También estará disponible para los usuarios gratuitos de ChatGPT a partir del lunes, con límites de uso. Los usuarios de ChatGPT Plus tendrán cinco veces más capacidad de mensajes que los usuarios gratuitos, y los clientes de ChatGPT Team y Enterprise tendrán límites de uso aún mayores.
Murati concluyó el evento transmitido en vivo agradeciendo al CEO de Nvidia, Jensen Huang, y a su empresa por proporcionar las unidades de procesamiento gráfico (GPU) necesarias para impulsar la tecnología de OpenAI.
“Solo quiero agradecer al increíble equipo de OpenAI, y también gracias a Jensen y al equipo de Nvidia por traernos las GPU más avanzadas para hacer posible esta demostración hoy”.