NoticiasTecnología

Usuarios de AWS Cloud ya tienen acceso a las NVIDIA H100

Usuarios de AWS Cloud ya tienen acceso a las NVIDIA H100

Los usuarios de AWS ya pueden acceder al rendimiento líder demostrado en las pruebas de referencia del sector de entrenamiento e inferencia de IA. El gigante de la nube ha encendido oficialmente una nueva instancia de Amazon EC2 P5 impulsada por las GPU NVIDIA H100 Tensor Core. El servicio permite a los usuarios escalar la IA generativa, la computación de alto rendimiento (HPC) y otras aplicaciones con un clic desde un navegador.

La noticia llega tras el momento iPhone de la IA. Desarrolladores e investigadores utilizan casi a diario grandes modelos lingüísticos (LLM) para descubrir nuevas aplicaciones de la IA. Llevar estos nuevos casos de uso al mercado requiere la eficiencia de la computación acelerada. La GPU NVIDIA H100 ofrece rendimiento de supercomputación a través de innovaciones arquitectónicas que incluyen Tensor Cores de cuarta generación, un nuevo Transformer Engine para acelerar los LLM y la última tecnología NVLink que permite que las GPU se comuniquen entre sí a 900 GB/seg.

Escalado con instancias P5

Las instancias P5 de Amazon EC2 son ideales para entrenar y ejecutar inferencia para LLM y modelos de visión informática cada vez más complejos. Estas redes neuronales impulsan las aplicaciones de IA generativa más exigentes y con mayor carga computacional, entre las que se incluyen la respuesta a preguntas, la generación de código, la generación de vídeo e imágenes, el reconocimiento del habla y mucho más.

Las instancias P5 pueden desplegarse en clústeres de hiperescala, denominados UltraClusters EC2, compuestos por computación, redes y almacenamiento de alto rendimiento en la nube. Cada EC2 UltraCluster es un potente superordenador que permite a los clientes ejecutar sus cargas de trabajo de formación de IA y HPC distribuidas más complejas en varios sistemas.

Para que los clientes puedan ejecutar a escala aplicaciones que requieren altos niveles de comunicaciones entre nodos de computación, la instancia P5 cuenta con redes sin bloqueo a escala petabit, impulsadas por AWS EFA, una interfaz de red de 3200 Gbps para instancias Amazon EC2.

Con las instancias P5, las aplicaciones de aprendizaje automático pueden utilizar la biblioteca de comunicaciones colectivas de NVIDIA para emplear hasta 20.000 GPU H100.

NVIDIA AI Enterprise ayuda a los usuarios a sacar el máximo partido de las instancias P5 con un paquete completo de software que incluye más de 100 frameworks, modelos preentrenados, flujos de trabajo de IA y herramientas para ajustar la infraestructura de IA.

Diseñado para agilizar el desarrollo y la implementación de aplicaciones de IA, NVIDIA AI Enterprise aborda las complejidades de crear y mantener una plataforma de software de IA nativa en la nube, segura y de alto rendimiento. Disponible en AWS Marketplace, ofrece monitorización continua de la seguridad, parches regulares y puntuales para vulnerabilidades y exposiciones comunes, estabilidad de la API y soporte empresarial, así como acceso a los expertos en IA de NVIDIA.

Carlos Cantor

Carlos Cantor

GeekAdicto
Ingeniero industrial apasionado por la tecnología. Colombiano amante de la cerveza. Adicto a los E-sports.