PUNTOS IMPORTANTES:
- AWS anuncia el nuevo chip Trainium2 y el procesador Graviton4, fortaleciendo su colaboración con Nvidia.
- AWS presenta opciones económicas y de alto rendimiento con los procesadores Graviton, ampliamente adoptados por más de 50.000 clientes.
- La demanda de GPUs de Nvidia se dispara, impulsada por la popularidad de tecnologías de IA generativa como ChatGPT.
La unidad de nube de Amazon, AWS, anunció su nuevo chip de inteligencia artificial Trainium2 y el procesador de propósito general Graviton4 durante su conferencia Reinvent en Las Vegas el martes. La compañía también dijo que ofrecerá acceso a las últimas unidades de procesamiento gráfico de IA H200 de Nvidia.
Innovaciones en AWS y colaboración con Nvidia
Amazon Web Services está intentando destacarse como proveedor de nube con una variedad de opciones rentables. Sin embargo, no solo venderá productos baratos de marca Amazon. Al igual que en su mercado minorista en línea, la nube de Amazon presentará productos de primera línea. Específicamente, esto significa GPU muy buscadas del principal fabricante de chips de IA, Nvidia.
El enfoque de doble vía podría poner a AWS en una mejor posición para competir con su principal competidor. A principios de este mes, Microsoft adoptó un enfoque similar al revelar su primer chip de IA, el Maia 100, y también anunció que la nube de Azure contará con GPU Nvidia H200.
Los procesadores Graviton4 se basan en la arquitectura Arm y consumen menos energía que los chips de Intel o AMD. Graviton4 promete un rendimiento un 30% mejor que los chips Graviton3 existentes, lo que, según AWS, permite una mejor relación calidad-precio. La inflación ha sido más alta de lo habitual, inspirando a los banqueros centrales a subir las tasas de interés. Las organizaciones que deseen seguir utilizando AWS pero reducir sus facturas de nube para lidiar mejor con la economía podrían considerar pasarse a Graviton.
Demanda de procesadores Graviton en AWS
Más de 50.000 clientes de AWS ya están usando chips Graviton. La startup Databricks y Anthropic, respaldada por Amazon y competidora de OpenAI, planean construir modelos con los nuevos chips Trainium2, que tendrán un rendimiento cuatro veces mejor que el modelo original, según dijo Amazon.
AWS dijo que operará más de 16.000 Nvidia GH200 Grace Hopper Superchips, que contienen GPU H100 y procesadores generales basados en Arm de Nvidia, para el grupo de investigación y desarrollo de Nvidia. Otros clientes de AWS no podrán usar estos chips.
La demanda de GPU de Nvidia se ha disparado desde que la startup OpenAI lanzó su chatbot ChatGPT el año pasado, asombrando a la gente con su capacidad para resumir información y componer texto de aspecto humano. Esto llevó a una escasez de chips de Nvidia, ya que las empresas se apresuraron a incorporar tecnologías de IA generativa similares en sus productos.
Amazon y Nvidia: Expansión y nuevas opciones
Normalmente, la introducción de un chip de IA por parte de un proveedor de nube podría representar un desafío para Nvidia, pero en este caso, Amazon está expandiendo simultáneamente su colaboración con Nvidia. Al mismo tiempo, los clientes de AWS tendrán otra opción a considerar para la informática de IA si no pueden asegurar las últimas GPU de Nvidia.
Amazon es el líder en computación en la nube, pero ha estado alquilando GPU en su nube durante más de una década. En 2018, siguió a los desafiantes de la nube Alibaba y Google al lanzar un procesador de IA que desarrolló internamente, ofreciendo a los clientes una informática potente a un precio asequible.
AWS ha lanzado más de 200 productos en la nube desde 2006, cuando lanzó sus servicios EC2 y S3 para computación y almacenamiento de datos. No todos han sido éxitos. Algunos se quedan sin actualizaciones durante mucho tiempo y unos pocos son descontinuados, liberando a Amazon para reasignar recursos. Sin embargo, la compañía continúa invirtiendo en los programas Graviton y Trainium, lo que sugiere que Amazon percibe demanda.
AWS no anunció fechas de lanzamiento para instancias de máquinas virtuales con chips Nvidia H200, ni instancias que dependan de su silicio Trainium2. Los clientes pueden comenzar a probar instancias de máquinas virtuales Graviton4 ahora antes de que estén disponibles comercialmente en los próximos meses.