PUNTOS IMPORTANTES:
- Google pausa su función de generación de imágenes IA Gemini por inexactitudes en imágenes históricas.
- La tecnológica promete mejoras y una versión «mejorada» próximamente.
- Google enfrenta el desafío de mantenerse al día con la innovación de IA, mientras aborda preocupaciones sobre representación y sesgo.
Google anunció el jueves que está pausando su función de generación de imágenes de inteligencia artificial Gemini, tras señalar que presenta «inexactitudes» en imágenes históricas.
Los usuarios en redes sociales expresaron su descontento porque la herramienta de IA generaba imágenes inexactas de figuras históricas, como los Padres Fundadores de EE. UU., representándolos como personas de color.
Google explicó en una publicación en X el miércoles que la característica de IA puede «generar una amplia gama de personas, lo cual es generalmente positivo ya que es utilizada por personas de todo el mundo». Sin embargo, reconocieron que la funcionalidad del software «no está cumpliendo con las expectativas en este caso», añadiendo que el gigante tecnológico «está trabajando para mejorar este tipo de representaciones de manera inmediata».
Google publicó una declaración actualizada el jueves, mencionando que pausará la función de Gemini para generar imágenes de personas y que lanzará una versión «mejorada» próximamente.
Desafíos y competencia en el mundo de la IA
La herramienta generadora de imágenes se lanzó a principios de febrero a través de Gemini, que previamente se conocía como Bard. Este lanzamiento se produce en un momento en el que Google está intentando no quedarse atrás respecto a OpenAI, que cuenta con el respaldo de Microsoft.
Gemini experimentó dificultades técnicas el jueves por la mañana, negándose a generar imágenes cuando fue probado por un reportero de CNBC.
Mientras Google enfrenta estos problemas con la creación de imágenes en Gemini, OpenAI lanzó la semana pasada Sora, su nuevo modelo de IA generativa capaz de producir videos a partir de prompts de texto proporcionados por los usuarios.
Jack Krawczyk, director sénior de producto para Gemini en Google, comunicó el miércoles que las capacidades de generación de imágenes de la compañía reflejan la «base de usuarios globales» del gigante tecnológico, y enfatizó que la empresa toma «la representación y el sesgo muy en serio».
«Continuaremos haciendo esto para prompts abiertos (¡las imágenes de una persona paseando un perro son universales!).
Los contextos históricos tienen más matices, y afinaremos aún más para adaptarnos a eso».
Krawczyk en una publicación en X.
Innovación y responsabilidad en la inteligencia artificial
Google lanzó Gemini, su modelo de IA más avanzado, a finales de 2023. Este mes, también cambió el nombre de Bard, su competidor de ChatGPT, a Gemini. Adicionalmente, Google lanzó un servicio de suscripción a una versión más potente del modelo de IA.