PUNTOS IMPORTANTES:
- Veo 3 permite crear videos con audio y lip sync realista.
- Google lo ofrece vía suscripción Ultra y Vertex AI empresarial.
- Imagen 4 y Flow también fueron anunciados para creadores.
Google (GOOGL) presentó este martes Veo 3, su nuevo generador de video con inteligencia artificial capaz de incorporar audio de manera nativa. A diferencia de herramientas como Sora, desarrollada por OpenAI, Veo 3 no solo genera imágenes en movimiento a partir de texto o imágenes, sino que también puede incluir diálogos sincronizados entre personajes y efectos sonoros como rugidos o ladridos.
“Veo 3 sobresale en la generación desde texto e imagen, con física realista y sincronización labial precisa”.
Eli Collins, vicepresidente de producto en Google DeepMind, en el blog oficial de la compañía.
La herramienta estará disponible en Estados Unidos a través del nuevo plan Ultra, una suscripción de 249,99 dólares mensuales dirigida a usuarios avanzados y entusiastas del uso intensivo de IA. También será accesible para clientes empresariales mediante la plataforma Vertex AI, lo que amplía su alcance en el segmento corporativo.
El anuncio de Veo 3 llega en un momento de fuerte competencia en el mercado de video generado por IA, con creciente demanda por parte de creadores, desarrolladores y empresas que buscan automatizar o acelerar la producción de contenido multimedia.
Imagen 4, Flow y otros lanzamientos del ecosistema
Junto con Veo 3, Google también reveló la cuarta versión de Imagen, su generador de imágenes por IA, que ahora promete una calidad superior gracias a mejoras en el procesamiento de prompts. La empresa busca recuperar la confianza del público tras los fallos de Imagen 3, cuya relanzamiento fue necesario en 2024 luego de que la herramienta generara imágenes históricamente inexactas, generando críticas generalizadas. El propio Sergey Brin admitió entonces que el problema se debió a una falta de pruebas exhaustivas.
Además, la compañía presentó Flow, una herramienta de asistencia creativa que permite generar videos cinematográficos describiendo ubicaciones, estilos visuales y secuencias narrativas. Flow estará disponible a través de Gemini, Whisk, Vertex AI y Workspace, ampliando así las capacidades de producción colaborativa con IA.
Otra novedad fue la apertura de Lyria 2, el modelo de generación musical de Google, para creadores de contenido en YouTube Shorts y empresas que utilizan Vertex AI. En paralelo, Veo 2 recibió una actualización que permite agregar o eliminar objetos dentro de un video usando simples instrucciones de texto.
Con esta serie de lanzamientos, Google refuerza su apuesta por los contenidos visuales como uno de los principales motores de la inteligencia artificial generativa. Desde OpenAI, su CEO Sam Altman ya había reconocido en marzo que la función de generación de imágenes de GPT-4o se volvió tan popular que saturó la capacidad de los chips, forzando a la compañía a limitar temporalmente su uso.
Descargo de responsabilidad: Toda la información encontrada en Bitfinanzas es dada con la mejor intención, esta no representa ninguna recomendación de inversión y es solo para fines informativos. Recuerda hacer siempre tu propia investigación.