Nov. 29, 2023 at 5:30 am

AWS Graviton4 y AWS Trainium2 son anunciados de manera oficial

En AWS re:Invent, Amazon Web Services, Inc. (AWS), una compañía de Amazon.com, Inc. (NASDAQ: AMZN), ha anunciado la próxima generación de dos familias de chips diseñadas por AWS -AWS Graviton4 y AWS Trainium2- que ofrecen avances en rendimiento de precios y eficiencia energética para una amplia gama de cargas de trabajo de clientes, incluyendo aplicaciones de formación de aprendizaje automático (ML) e inteligencia artificial generativa (AI). Graviton4 y Trainium2 marcan las últimas innovaciones en diseño de chips de AWS. Con cada generación sucesiva de chips, AWS ofrece un mejor rendimiento de precio y eficiencia energética, dando a los clientes aún más opciones, además de combinaciones de chip/instancia con los últimos chips de terceros como AMD, Intel y NVIDIA, para ejecutar prácticamente cualquier aplicación o carga de trabajo en Amazon Elastic Compute Cloud (Amazon EC2).

Graviton4 proporciona hasta un 30% más de rendimiento informático, un 50% más de núcleos y un 75% más de ancho de banda de memoria que la generación actual de procesadores Graviton3, ofreciendo el mejor rendimiento en precio y eficiencia energética para una amplia gama de cargas de trabajo que se ejecutan en Amazon EC2.

Trainium2 está diseñado para ofrecer un entrenamiento hasta 4 veces más rápido que los chips Trainium de primera generación y podrá desplegarse en UltraClusters EC2 de hasta 100.000 chips, lo que permitirá entrenar modelos de fundamentos (FM) y grandes modelos de lenguaje (LLM) en una fracción del tiempo, al tiempo que mejora la eficiencia energética hasta 2 veces.
«El silicio es la base de todas las cargas de trabajo de los clientes, lo que lo convierte en un área crítica de innovación para AWS», afirma David Brown, vicepresidente de Computación y Redes de AWS. Al centrar nuestros diseños de chips en las cargas de trabajo reales que importan a los clientes, podemos ofrecerles la infraestructura de nube más avanzada». Graviton4 marca la cuarta generación que hemos entregado en sólo cinco años, y es el chip más potente y energéticamente eficiente que hemos construido para una amplia gama de cargas de trabajo. Y con el aumento del interés por la IA generativa, Tranium2 ayudará a los clientes a entrenar sus modelos ML más rápido, a menor coste y con mayor eficiencia energética.»

Graviton4 sube el listón en rendimiento de precio y eficiencia energética para una amplia gama de cargas de trabajo

En la actualidad, AWS ofrece más de 150 tipos diferentes de instancias Amazon EC2 con Graviton a escala global, ha construido más de 2 millones de procesadores Graviton y cuenta con más de 50.000 clientes -incluidos los 100 principales clientes de EC2- que utilizan instancias basadas en Graviton para conseguir el mejor rendimiento en precio para sus aplicaciones. Clientes como Datadog, DirecTV, Discovery, Fórmula 1 (F1), NextRoll, Nielsen, Pinterest, SAP, Snowflake, Sprinklr, Stripe y Zendesk utilizan instancias basadas en Graviton para ejecutar una amplia gama de cargas de trabajo, como bases de datos, análisis, servidores web, procesamiento por lotes, publicación de anuncios, servidores de aplicaciones y microservicios. A medida que los clientes llevan a la nube bases de datos en memoria y cargas de trabajo analíticas más grandes, aumentan sus requisitos de computación, memoria, almacenamiento y redes. Como resultado, necesitan un rendimiento aún mayor y tamaños de instancia más grandes para ejecutar estas exigentes cargas de trabajo, al tiempo que gestionan los costes. Además, los clientes quieren opciones de computación más eficientes energéticamente para sus cargas de trabajo con el fin de reducir su impacto en el medio ambiente. Graviton es compatible con muchos servicios administrados de AWS, incluidos Amazon Aurora, Amazon ElastiCache, Amazon EMR, Amazon MemoryDB, Amazon OpenSearch, Amazon Relational Database Service (Amazon RDS), AWS Fargate y AWS Lambda, lo que aporta los beneficios de rendimiento de precios de Graviton a los usuarios de esos servicios.

Los procesadores Graviton4 ofrecen hasta un 30% más de rendimiento informático, un 50% más de núcleos y un 75% más de ancho de banda de memoria que Graviton3. Graviton4 también sube el listón de la seguridad al cifrar completamente todas las interfaces físicas de hardware de alta velocidad. Graviton4 estará disponible en instancias Amazon EC2 R8g optimizadas para memoria, lo que permitirá a los clientes mejorar la ejecución de sus bases de datos de alto rendimiento, cachés en memoria y cargas de trabajo de análisis de big data. Las instancias R8g ofrecen instancias de mayor tamaño con hasta 3 veces más vCPUs y 3 veces más memoria que las instancias R7g de la generación actual. Esto permite a los clientes procesar mayores cantidades de datos, escalar sus cargas de trabajo, mejorar el tiempo de obtención de resultados y reducir el coste total de propiedad. Las instancias R8g impulsadas por Graviton4 están disponibles hoy en versión preliminar, y su disponibilidad general está prevista para los próximos meses. Para obtener más información sobre las instancias R8g basadas en Graviton4, visite aws.amazon.com/ec2/instance-types/r8g.

Los UltraClusters EC2 de Trainum2 están diseñados para ofrecer la infraestructura de entrenamiento de modelos de IA de mayor rendimiento y más eficiente energéticamente en la nube
Los FM y LLM que hay detrás de las aplicaciones de IA generativa emergentes de hoy en día se entrenan en conjuntos de datos masivos. Estos modelos permiten a los clientes reimaginar completamente las experiencias de los usuarios mediante la creación de una variedad de nuevos contenidos, como texto, audio, imágenes, vídeo e incluso código de software. En la actualidad, los MF y LLM más avanzados abarcan desde cientos de miles de millones a billones de parámetros, lo que requiere una capacidad informática fiable de alto rendimiento capaz de escalar en decenas de miles de chips ML. AWS ya ofrece la mayor variedad de instancias de Amazon EC2 con chips de ML, incluidas las últimas GPU NVIDIA, Trainium e Inferentia2. En la actualidad, clientes como Databricks, Helixon, Money Forward y el equipo de Amazon Search utilizan Trainium para entrenar modelos de aprendizaje profundo a gran escala, aprovechando el alto rendimiento, la escala, la fiabilidad y el bajo coste de Trainium. Pero incluso con las instancias aceleradas más rápidas disponibles hoy en día, los clientes quieren más rendimiento y escala para entrenar estos modelos cada vez más sofisticados de forma más rápida, a un coste menor y reduciendo al mismo tiempo la cantidad de energía que utilizan.

Los chips Trainium2 están especialmente diseñados para el entrenamiento de alto rendimiento de FM y LLM con hasta billones de parámetros. Trainium2 está diseñado para ofrecer un rendimiento de entrenamiento hasta 4 veces más rápido y 3 veces más capacidad de memoria en comparación con los chips Trainium de primera generación, al tiempo que mejora la eficiencia energética (rendimiento/vatio) hasta 2 veces. Trainium2 estará disponible en instancias Amazon EC2 Trn2, que contienen 16 chips Trainium en una única instancia. Las instancias Trn2 están pensadas para permitir a los clientes escalar hasta 100.000 chips Trainium2 en UltraClusters EC2 de nueva generación, interconectados con redes a escala petabit AWS Elastic Fabric Adapter (EFA), ofreciendo hasta 65 exaflops de computación y proporcionando a los clientes acceso bajo demanda a un rendimiento de clase supercomputadora. Con este nivel de escala, los clientes pueden entrenar un LLM de 300.000 millones de parámetros en semanas en lugar de meses. Al ofrecer el mayor rendimiento de entrenamiento de ML a escala a un coste significativamente menor, las instancias Trn2 pueden ayudar a los clientes a desbloquear y acelerar la próxima ola de avances en IA generativa.

Líder en la defensa del despliegue responsable de la IA generativa, Anthropic es una empresa de seguridad e investigación de IA que crea sistemas de IA fiables, interpretables y dirigibles. Cliente de AWS desde 2021, Anthropic lanzó recientemente Claude, un asistente de IA centrado en ser útil, inofensivo y honesto. «Desde su lanzamiento en Amazon Bedrock, Claude ha visto una rápida adopción por parte de los clientes de AWS», dijo Tom Brown, cofundador de Anthropic. «Estamos trabajando estrechamente con AWS para desarrollar nuestros futuros modelos de base utilizando chips Trainium. Trainium2 nos ayudará a construir y entrenar modelos a gran escala, y esperamos que sea al menos 4 veces más rápido que la primera generación de chips Trainium para algunas de nuestras cargas de trabajo clave. Nuestra colaboración con AWS ayudará a organizaciones de todos los tamaños a desbloquear nuevas posibilidades, ya que utilizan los sistemas de IA de última generación de Anthropic junto con la tecnología de nube segura y fiable de AWS.»

Más de 10.000 organizaciones de todo el mundo -incluidas Comcast, Condé Nast y más del 50% de Fortune 500- confían en Databricks para unificar sus datos, análisis e IA. «Miles de clientes han implementado Databricks en AWS, dándoles la capacidad de utilizar MosaicML para pre-entrenar, afinar y servir FMs para una variedad de casos de uso», dijo Naveen Rao, vicepresidente de Generative AI en Databricks. «AWS Trainium nos proporciona la escala y el alto rendimiento necesarios para entrenar nuestros modelos Mosaic MPT, y a un bajo costo. A medida que entrenemos nuestra próxima generación de modelos Mosaic MPT, Trainium2 hará posible construir modelos aún más rápido, lo que nos permitirá ofrecer a nuestros clientes una escala y un rendimiento sin precedentes para que puedan llevar sus propias aplicaciones de IA generativa al mercado más rápidamente.»

Datadog es una plataforma de observabilidad y seguridad que proporciona visibilidad completa en todas las organizaciones. «En Datadog, ejecutamos decenas de miles de nodos, por lo que equilibrar el rendimiento y la rentabilidad es extremadamente importante. Es por eso que ya ejecutamos la mitad de nuestra flota de Amazon EC2 en Graviton», dijo Laurent Bernaille, ingeniero principal de Datadog. «La integración de instancias basadas en Graviton4 en nuestro entorno fue perfecta y nos proporcionó un aumento inmediato del rendimiento nada más sacarlo de la caja, y estamos deseando utilizar Graviton4 cuando esté disponible de forma general.»

Epic es una empresa líder en entretenimiento interactivo y proveedora de tecnología de motores 3D. Epic opera Fortnite, uno de los juegos más grandes del mundo con más de 350 millones de cuentas y 2500 millones de conexiones de amigos. «Las instancias AWS Graviton4 son las instancias EC2 más rápidas que hemos probado, y están ofreciendo un rendimiento excepcional en nuestras cargas de trabajo más competitivas y sensibles a la latencia», dijo Roman Visintine, ingeniero jefe de la nube en Epic. «Estamos deseando utilizar Graviton4 para mejorar la experiencia de los jugadores y ampliar lo que es posible dentro de Fortnite».

Honeycomb es la plataforma de observabilidad que permite a los equipos de ingeniería encontrar y resolver problemas que antes no podían. «Estamos encantados de haber evaluado las instancias R8g basadas en AWS Graviton4″, dijo Liz Fong-Jones, Field CTO de Honeycomb. En pruebas recientes, nuestra carga de trabajo de ingesta de datos OpenTelemetry basada en Go necesitó un 25% menos de réplicas en las instancias R8g basadas en Graviton4 en comparación con las instancias C7g/M7g/R7g basadas en Graviton3, y además logró una mejora del 20% en la latencia media y del 10% en la latencia del percentil 99″. Estamos deseando aprovechar las instancias basadas en Graviton4 una vez que estén disponibles de forma general».

SAP HANA Cloud, la base de datos in-memory nativa de la nube de SAP, es la base de gestión de datos de SAP Business Technology Platform (SAP BTP). «Los clientes confían en SAP HANA Cloud para ejecutar sus procesos de negocio de misión crítica y sus aplicaciones de datos inteligentes de próxima generación en la nube», afirma Juergen Mueller, CTO y miembro del Consejo Ejecutivo de SAP SE. «Como parte del proceso de migración de SAP HANA Cloud a las instancias Amazon EC2 basadas en AWS Graviton, ya hemos observado hasta un 35% más de rendimiento en precio para las cargas de trabajo analíticas. En los próximos meses, esperamos validar Graviton4, y los beneficios que puede aportar a nuestros clientes conjuntos.»