IBM anunció hoy la próxima disponibilidad general de IBM Spyre Accelerator, un acelerador de IA que permite la inferencia de baja latencia para admitir casos de uso de IA generativa y agencial al tiempo que prioriza la seguridad y la resiliencia de las cargas de trabajo principales. A principios de este año, IBM anunció que Spyre Accelerator estaría disponible en los sistemas IBM z17, LinuxONE 5 y Power11. Spyre estará disponible de forma general el 28 de octubre para los sistemas IBM z17 y LinuxONE 5, y a principios de diciembre para los servidores Power11.
El panorama actual de TI está cambiando de los flujos de trabajo lógicos tradicionales a la inferencia de IA agencial. Los agentes de IA requieren inferencia de baja latencia y capacidad de respuesta del sistema en tiempo real. IBM reconoció la necesidad de que los mainframes y servidores ejecuten modelos de IA junto con las cargas de trabajo empresariales más exigentes sin comprometer el rendimiento. Para abordar esta demanda, los clientes necesitan hardware de inferencia de IA que admita IA generativa y agencial mientras mantiene la seguridad y la resiliencia de los datos, transacciones y aplicaciones centrales. El acelerador también está diseñado para permitir a los clientes mantener los datos de misión crítica en las instalaciones para mitigar el riesgo mientras se aborda la eficiencia operativa y energética.
IBM Spyre Accelerator refleja la fortaleza de la línea de investigación a producto de IBM, combinando la innovación revolucionaria del IBM Research AI Hardware Center con el desarrollo de nivel empresarial de IBM Infrastructure. Inicialmente presentado como un chip prototipo, Spyre se refinó a través de una iteración rápida, incluidas implementaciones de clústeres en el campus de IBM en Yorktown Heights y con colaboradores como el Centro de Sistemas de Inteligencia Artificial Emergentes de la Universidad de Albany.
El prototipo de IBM Research se ha convertido en un producto de nivel empresarial para su uso en sistemas IBM Z, LinuxONE y Power. Hoy en día, el Acelerador Spyre es un sistema comercial en un chip con 32 núcleos de acelerador individuales y 25.6 mil millones de transistores. Producido con tecnología de nodo de 5 nm, cada Spyre está montado en una tarjeta PCIe de 75 vatios, lo que permite agrupar hasta 48 tarjetas en un sistema IBM Z o LinuxONE o 16 tarjetas en un sistema IBM Power para escalar las capacidades de IA.
«Una de nuestras prioridades clave ha sido avanzar en la infraestructura para satisfacer las demandas de cargas de trabajo de IA nuevas y emergentes», dijo Barry Baker, COO, IBM Infrastructure & GM, IBM Systems. «Con el Acelerador Spyre, estamos ampliando las capacidades de nuestros sistemas para admitir IA multimodelo, incluida la IA generativa y agencial. Esta innovación posiciona a los clientes para escalar sus cargas de trabajo de misión crítica habilitadas por IA con seguridad, resiliencia y eficiencia sin concesiones, al tiempo que desbloquea el valor de sus datos empresariales».
«Lanzamos el Centro de Hardware de IA de IBM Research en 2019 con la misión de satisfacer las crecientes demandas computacionales de la IA, incluso antes del aumento de LLM y modelos de IA que hemos visto recientemente», dijo Mukesh Khare, gerente general de IBM Semiconductors y vicepresidente de nube híbrida de IBM. «Ahora, en medio de la creciente demanda de capacidades avanzadas de IA, estamos orgullosos de ver que el primer chip del Centro entra en comercialización, diseñado para ofrecer un rendimiento y una productividad mejorados a los clientes de mainframe y servidores de IBM».
Para los clientes de IBM, los aceleradores Spyre ofrecen un procesamiento rápido y seguro con aceleración de IA local. Esto marca un hito importante, ya que permite a las empresas aprovechar la IA a escala mientras mantienen los datos en los sistemas IBM Z, LinuxONE y Power. En los sistemas mainframe, junto con el procesador Telum II para IBM Z y LinuxONE, Spyre ofrece seguridad mejorada, baja latencia y alta potencia de procesamiento de tasa de transacción. Aprovechando esta pila avanzada de hardware y software, las empresas pueden usar Spyre para escalar múltiples modelos de IA para impulsar casos de uso predictivos, como la detección avanzada de fraudes y la automatización minorista.
En los servidores basados en IBM Power, los clientes de Spyre pueden aprovechar un catálogo de servicios de IA, lo que permite la IA de extremo a extremo para los flujos de trabajo empresariales. Los clientes pueden instalar los servicios de IA desde el catálogo con un solo clic. Spyre Accelerator for Power, combinado con un acelerador en chip (MMA), también acelera la conversión de datos para que la IA generativa ofrezca un alto rendimiento para integraciones de procesos profundas. Además, con un tamaño de solicitud de 128, permite la ingesta de más de 8 millones de documentos para la integración de la base de conocimientos en una hora. Este rendimiento, combinado con la pila de software de IBM, la seguridad, la escalabilidad y la eficiencia energética, respalda a los clientes en su viaje hacia la integración de marcos de IA generativa en sus cargas de trabajo empresariales.