NVIDIA anunció la próxima evolución de la plataforma de fábrica de IA NVIDIA Blackwell, NVIDIA Blackwell Ultra, allanando el camino para la era del razonamiento de IA. NVIDIA Blackwell Ultra impulsa el entrenamiento y la inferencia de escalado en tiempo de prueba, el arte de aplicar más computación durante la inferencia para mejorar la precisión, para permitir que las organizaciones de todo el mundo aceleren aplicaciones como el razonamiento de IA, la IA agentiva y la IA física.
Construido sobre la innovadora arquitectura Blackwell introducida hace un año, Blackwell Ultra incluye la solución de escala de rack NVIDIA GB300 NVL72 y el sistema NVIDIA HGX B300 NVL16. El GB300 NVL72 ofrece 1,5 veces más rendimiento de IA que el NVIDIA GB200 NVL72, además de aumentar las oportunidades de ingresos de Blackwell en 50 veces para las fábricas de IA, en comparación con las construidas con NVIDIA Hopper.
«La IA ha dado un salto gigante: el razonamiento y la IA agentiva exigen órdenes de magnitud más rendimiento informático», dijo Jensen Huang, fundador y CEO de NVIDIA. «Diseñamos Blackwell Ultra para este momento: es una plataforma única y versátil que puede realizar inferencias de IA previas, posteriores y de razonamiento de manera fácil y eficiente».
NVIDIA Blackwell Ultra permite el razonamiento de IA
La NVIDIA GB300 NVL72 conecta 72 GPU Blackwell Ultra y 36 CPU NVIDIA Grace basadas en ArmNeoverse en un diseño a escala de rack, que actúa como una sola GPU masiva creada para el escalado en tiempo de prueba. Con NVIDIA GB300 NVL72, los modelos de IA pueden acceder a la mayor capacidad de cómputo de la plataforma para explorar diferentes soluciones a problemas y dividir solicitudes complejas en varios pasos, lo que da como resultado respuestas de mayor calidad.
También se espera que GB300 NVL72 esté disponible en NVIDIA DGX Cloud, una plataforma de IA de extremo a extremo totalmente gestionada en las principales nubes que optimiza el rendimiento con software, servicios y experiencia en IA para cargas de trabajo en evolución. NVIDIA DGX SuperPOD con sistemas DGX GB300 utiliza el diseño de rack GB300 NVL72 para proporcionar a los clientes una fábrica de IA llave en mano.
La NVIDIA HGX B300 NVL16 presenta una inferencia 11 veces más rápida en modelos de lenguaje grandes, 7 veces más computación y 4 veces más memoria en comparación con la generación Hopper para ofrecer un rendimiento innovador para las cargas de trabajo más complejas, como el razonamiento de IA.
Además, la plataforma Blackwell Ultra es ideal para aplicaciones que incluyen:
- IA agente, que utiliza un razonamiento sofisticado y una planificación iterativa para resolver de forma autónoma problemas complejos de varios pasos. Los sistemas de agentes de IA van más allá del seguimiento de instrucciones. Pueden razonar, planificar y tomar medidas para lograr objetivos específicos.
- IA física, que permite a las empresas generar vídeos sintéticos y fotorrealistas en tiempo real para el entrenamiento de aplicaciones como robots y vehículos autónomos a escala.
Infraestructura de escalabilidad horizontal de NVIDIA para un rendimiento óptimo
Las redes de escalabilidad horizontal avanzadas son un componente crítico de la infraestructura de IA que puede ofrecer el máximo rendimiento al tiempo que reduce la latencia y la fluctuación.
Los sistemas Blackwell Ultra se integran a la perfección con las plataformas NVIDIA Spectrum-X Ethernet y NVIDIA Quantum-X800 InfiniBand, con 800 Gb/s de rendimiento de datos disponibles para cada GPU del sistema, a través de NVIDIA ConnectX -8 SuperNIC. Esto ofrece las mejores capacidades de acceso directo a memoria remota de su clase para permitir que las fábricas de IA y los centros de datos en la nube manejen modelos de razonamiento de IA sin cuellos de botella.
Las DPU NVIDIA BlueField -3, también incluidas en los sistemas Blackwell Ultra, permiten redes multiusuario, elasticidad de cómputo de GPU, acceso acelerado a datos y detección de amenazas de ciberseguridad en tiempo real.
Los líderes mundiales en tecnología adoptan Blackwell Ultra
Se espera que los productos basados en Blackwell Ultra estén disponibles a través de los socios a partir de la segunda mitad de 2025.
Se espera que Cisco, Dell Technologies, Hewlett Packard Enterprise, Lenovo y Supermicro entreguen una amplia gama de servidores basados en productos Blackwell Ultra, además de Aivres, ASRock Rack, ASUS, Eviden, Foxconn, GIGABYTE, Inventec, Pegatron, Quanta Cloud Technology (QCT), Wistron y Wiwynn.
Los proveedores de servicios en la nube Amazon Web Services, Google Cloud, Microsoft Azure y Oracle Cloud Infrastructure y los proveedores de nube de GPU CoreWeave, Crusoe, Lambda, Nebius, Nscale, Yotta e YTL estarán entre los primeros en ofrecer instancias con tecnología Blackwell Ultra.
Las innovaciones de software de NVIDIA reducen los cuellos de botella de la IA
Toda la cartera de productos de NVIDIA Blackwell es compatible con la plataforma de IA NVIDIA de pila completa. El marco de inferencia de código abierto de NVIDIA Dynamo, también anunciado hoy, amplía los servicios de IA de razonamiento, lo que ofrece saltos en el rendimiento al tiempo que reduce los tiempos de respuesta y los costos de servicio de modelos al proporcionar la solución más eficiente para escalar la computación en tiempo de prueba.
NVIDIA Dynamo es un nuevo software de servicio de inferencia de IA diseñado para maximizar la generación de ingresos por tokens para las fábricas de IA que implementan modelos de IA de razonamiento. Orquesta y acelera la comunicación de inferencia a través de miles de GPU, y utiliza servicios desagregados para separar las fases de procesamiento y generación de grandes modelos de lenguaje en diferentes GPU. Esto permite que cada fase se optimice de forma independiente para sus necesidades específicas y garantiza la máxima utilización de los recursos de la GPU.
Los sistemas Blackwell son ideales para ejecutar los nuevos modelos NVIDIA Llama Nemotron Reason y el NVIDIA AI-Q Blueprint, compatible con la plataforma de software NVIDIA AI Enterprise para IA de nivel de producción. NVIDIA AI Enterprise incluye microservicios NVIDIA NAM, así como marcos, bibliotecas y herramientas de IA que las empresas pueden implementar en nubes, centros de datos y estaciones de trabajo acelerados por NVIDIA.
La plataforma Blackwell se basa en el ecosistema de potentes herramientas de desarrollo de NVIDIA, las bibliotecas NVIDIA CUDA-X, más de 6 millones de desarrolladores y 4.000+ aplicaciones que escalan el rendimiento en miles de GPU.