Intel Corporation y Google anunciaron una colaboración plurianual para avanzar en la próxima generación de infraestructura de IA y nube, reforzando el papel fundamental de las CPUs y las unidades de procesamiento de infraestructura (IPU) personalizadas en la escalabilidad de sistemas de IA modernos y heterogéneos.
A medida que la adopción de la IA se acelera, la infraestructura se vuelve más compleja y heterogénea, lo que impulsa una mayor dependencia de las CPUs para la orquestación, el procesamiento de datos y el rendimiento a nivel de sistema. A través de esta colaboración, Intel y Google se alinearán a lo largo de varias generaciones de procesadores Intel Xeon para mejorar el rendimiento, la eficiencia energética y el coste total de propiedad en toda la infraestructura global de Google.
La IA no funciona solo con aceleradores, funciona con sistemas. Y las CPU están en el núcleo de esos sistemas
Google Cloud sigue desplegando procesadores Intel Xeon en sus instancias optimizadas para cargas de trabajo, incluyendo los últimos procesadores Intel Xeon 6 que alimentan instancias C4 y N4. Estas plataformas soportan una amplia gama de cargas de trabajo, desde la coordinación de entrenamiento de IA a gran escala hasta la inferencia sensible a la latencia y la computación de propósito general.
Paralelamente, Intel y Google están ampliando su co-desarrollo de IPUs personalizadas basadas en ASIC. Estos aceleradores programables descargan funciones de red, almacenamiento y seguridad de las CPUs anfitriones, mejorando la utilización, aumentando la eficiencia y permitiendo un rendimiento más predecible en entornos de IA hiperescalada.
Las IPUs son un componente fundamental de las arquitecturas modernas de centros de datos. Al gestionar tareas de infraestructura tradicionalmente gestionadas por CPUs, desbloquean una mayor capacidad de cómputo efectiva y permiten a los proveedores de la nube escalar de forma más eficiente sin aumentar la complejidad global del sistema. Juntos, las CPUs y IPUs Xeon forman una plataforma estrechamente integrada que equilibra la computación de propósito general con la aceleración de infraestructura diseñada específicamente para ofrecer sistemas de IA más eficientes, flexibles y escalables.
Impulsar el rendimiento y la eficiencia a gran escala
«La IA está transformando la forma en que se construye y escala la infraestructura», dijo Lip-Bu Tan, CEO de Intel. «La IA escalable requiere más que aceleradores: requiere sistemas equilibrados. Las CPUs y las IPUs son fundamentales para ofrecer el rendimiento, la eficiencia y la flexibilidad que exigen las cargas de trabajo modernas de IA.»
«Las CPUs y la aceleración de infraestructuras siguen siendo una piedra angular de los sistemas de IA, desde la orquestación del entrenamiento hasta la inferencia y el despliegue», afirmó Amin Vahdat, vicepresidente senior y jefe de tecnólogos de infraestructura de IA de Google. «Intel ha sido un socio de confianza durante casi dos décadas, y su hoja de ruta Xeon nos da confianza en que podemos seguir respondiendo a las crecientes demandas de rendimiento y eficiencia de nuestras cargas de trabajo.»
Construyendo las bases para la próxima ola de IA
La colaboración ampliada refleja un compromiso compartido con el avance de una infraestructura abierta y escalable para la era de la IA. Al combinar computación de propósito general con aceleración de infraestructura diseñada específicamente para ello, Intel y Google están permitiendo un enfoque más equilibrado en el diseño de sistemas de IA, uno que mejora la utilización, reduce la complejidad y escala de forma más eficiente.
Juntas, las empresas están reforzando las bases para la próxima generación de servicios en la nube impulsados por IA, apoyando la innovación continua en empresas, desarrolladores y usuarios de todo el mundo.

