Red Hat y AMD anunciaron una colaboración estratégica para impulsar las capacidades de IA y optimizar la infraestructura virtualizada. Con esta alianza profundizada, Red Hat y AMD ampliarán las opciones de los clientes en la nube híbrida, desde la implementación de modelos de IA optimizados y eficientes hasta la modernización más rentable de las máquinas virtuales (VM) tradicionales. A medida que la demanda y la diversidad de la carga de trabajo continúan aumentando con la introducción de la IA, las organizaciones deben tener la capacidad y los recursos para cumplir con estos requisitos cada vez mayores. Sin embargo, el centro de datos promedio se dedica principalmente a los sistemas de TI tradicionales, lo que deja poco espacio para soportar cargas de trabajo intensivas como la IA. Para responder a esta necesidad, Red Hat y AMD están uniendo el poder de las soluciones de código abierto líderes en la industria de Red Hat con la cartera integral de arquitecturas de computación de alto rendimiento de AMD.
AMD y Red Hat: Impulsando una IA generativa más eficiente
Red Hat y AMD están combinando el poder de Red Hat AI con la cartera de procesadores y arquitecturas de GPU basados en x86 de AMD para respaldar entornos optimizados, rentables y listos para la producción para cargas de trabajo habilitadas para IA. Las GPU AMD Instinct ahora están completamente habilitadas en Red Hat OpenShift AI, lo que brinda a los clientes la potencia de procesamiento de alto rendimiento necesaria para las implementaciones de IA en la nube híbrida sin requisitos extremos de recursos. Además, mediante el uso de GPU AMD Instinct MI300X con Red Hat Enterprise Linux AI, Red Hat y AMD realizaron pruebas en Microsoft Azure ND MI300X v5 para demostrar con éxito la inferencia de IA para escalar modelos de lenguaje pequeños (SLM), así como modelos de lenguaje grandes (LLM) implementados en varias GPU en una sola máquina virtual, lo que reduce la necesidad de implementar en varias máquinas virtuales y reduce los costos de rendimiento.
Para impulsar aún más las capacidades de aceleración y ajuste del rendimiento, Red Hat y AMD están colaborando en la comunidad vLLM upstream para fomentar una inferencia de IA más eficiente. Con esta activación ascendente, Red Hat y AMD pretenden ofrecer:
- Rendimiento mejorado en las GPU de AMD: Al aumentar la biblioteca del kernel de AMD y optimizar varios componentes, como el kernel Triton y FP8, Red Hat y AMD están mejorando el rendimiento de inferencia para modelos densos y cuantificados, lo que permite una ejecución más rápida y eficiente de vLLM en los aceleradores AMD Instinct MI300X.
- Compatibilidad mejorada con múltiples GPU: la mejora de la comunicación colectiva y la optimización de las cargas de trabajo de varias GPU abren la puerta a implementaciones de IA más escalables y energéticamente eficientes, lo que es particularmente beneficioso para las cargas de trabajo que requieren computación distribuida en múltiples GPU, lo que reduce los cuellos de botella y mejora el rendimiento general.
- Compromiso ampliado con el ecosistema de vLLM: La colaboración cruzada entre Red Hat, AMD y otros líderes de la industria, como IBM, ayuda a acelerar el desarrollo ascendente para impulsar mejoras continuas tanto para el proyecto vLLM como para la optimización de la GPU de AMD, lo que beneficia aún más a los usuarios de vLLM que confían en el hardware de AMD para la inferencia y el entrenamiento de IA.
Sobre la base de esta colaboración en la comunidad vLLM, las GPU AMD Instinct serán compatibles con Red Hat AI Inference Server, la distribución de nivel empresarial de vLLM de Red Hat, lista para usar para un servidor de inferencia de IA potente, confiable y escalable. Como el principal contribuyente comercial a vLLM, Red Hat se compromete a permitir la compatibilidad al implementar vLLM en el hardware de elección de una organización, que incluye las GPU AMD Instinct. La ejecución de vLLM en las GPU AMD Instinct permite a las organizaciones implementar cualquier modelo de IA de código abierto en hardware de GPU validado y probado para una optimización y un rendimiento sobresalientes.
Las CPU AMD EPYC también permiten un rendimiento de IA de extremo a extremo y son ideales para alojar sistemas habilitados para GPU. Esto puede ayudar a mejorar el rendimiento y el retorno de la inversión (ROI) de cada servidor de GPU incluso para las cargas de trabajo de IA más exigentes.
Transformación del centro de datos moderno
Al optimizar las huellas de los centros de datos existentes, las organizaciones pueden reinvertir recursos de manera más efectiva y fácil para permitir la innovación en IA. Red Hat OpenShift Virtualization, una característica de Red Hat OpenShift, ofrece una ruta optimizada para que las organizaciones migren y administren cargas de trabajo de VM con la simplicidad y la velocidad de una plataforma de aplicaciones nativas de la nube. Red Hat OpenShift Virtualization está validado para los procesadores AMD EPYC capaces de aprovechar el excelente rendimiento y la eficiencia energética de los procesadores AMD EPYC, dondequiera que sea necesario en la nube híbrida, al tiempo que se mantiene un puente hacia un futuro nativo de la nube.
Red Hat OpenShift Virtualization en CPU AMD EPYC ayuda a las empresas a optimizar la implementación de aplicaciones en servidores líderes, como los productos Dell PowerEdge, HPE ProLiant y Lenovo ThinkSystem. Al actualizar un centro de datos heredado, Red Hat OpenShift Virtualization proporciona la unificación de máquinas virtuales y aplicaciones en contenedores, en las instalaciones, en nubes públicas o en la nube híbrida. Esto ayuda a permitir altos índices de consolidación de la infraestructura que pueden conducir a un costo total de propiedad (TCO) significativamente más bajo en las dimensiones de hardware, licencias de software y energía. Esto tiene el beneficio adicional de permitir que los equipos de TI administren de manera más efectiva las cargas de trabajo críticas en la actualidad, al tiempo que liberan recursos y energía para aplicarlos a las cargas de trabajo de IA ahora y en el futuro.