SambaNova ha anunciado la siguiente fase de su colaboración con Intel: una solución de hardware heterogénea que combina GPUs para el precargado, procesadores Intel Xeon 6 como CPUs anfitrión y «acción», y RDUs SambaNova para la decodificación que ofrezca inferencia premium para las aplicaciones de IA Agentic más exigentes. El diseño estará disponible en el segundo semestre de 2026 para empresas, proveedores de nube y programas de IA soberanos que quieran ejecutar agentes de codificación y otras cargas de trabajo agenticas a gran escala.
«La IA agente está entrando en producción, y el patrón ganador que estamos viendo son GPUs para empezar el trabajo, Intel Xeon 6 para ejecutarlo y RDUs SambaNova para terminarlo rápido», dijo Rodrigo Liang, CEO y cofundador de SambaNova Systems. «Junto con Intel, estamos dando a los clientes un plano que pueden desplegar en los centros de datos refrigerados por aire existentes, con una amplia cobertura x86 para los agentes y herramientas de codificación que ya utilizan hoy en día.»
«El ecosistema de software para centros de datos se basa en x86, y funciona con Xeon, proporcionando una base madura y probada en la que desarrolladores, empresas y proveedores de la nube confían a gran escala», dijo Kevork Kechichian, vicepresidente ejecutivo y director general del Grupo de Centros de Datos (DCG) en Intel Corporation. «Las cargas de trabajo del futuro requerirán una mezcla heterogénea de computación, y esta colaboración con SambaNova ofrece una arquitectura de inferencia rentable y de alto rendimiento diseñada para satisfacer las necesidades del cliente a gran escala, impulsada por Xeon 6.»
La IA agente se convierte en la corriente principal
La IA agente ha pasado de demos a despliegues, ya que los agentes de codificación ahora compilan y ejecutan código, llaman a herramientas y APIs, conectan bases de datos y coordinan flujos de trabajo en una inferencia rápida y de baja latencia en modelos grandes. En el proceso, están exponiendo los límites de las pilas solo de GPU: las GPUs gestionan el precargado, pero las CPUs y los aceleradores de inferencia dedicados deciden ahora cuán rápido y eficiente se ejecutan, escalan y optimizan las cargas de trabajo reales de agentes en producción.
«Estamos viendo cómo la producción de código de los agentes de IA crece exponencialmente y, como resultado, Daytona ve la necesidad de cada vez más sandboxes para ejecutar y compilar este código, que funciona con CPUs como el Xeon de Intel», dijo Ivan Burazin, CEO de Daytona, una empresa de infraestructura de codificación segura para IA agente.
«La inferencia de producción avanza hacia hardware heterogéneo: ningún tipo de chip es óptimo para cada etapa de un flujo de trabajo agente. Lo que hace que el blueprint de Intel y SambaNova destaque es que combina RDUs reconfigurables para un decodificado rápido con CPUs Intel Xeon para la ejecución de herramientas agentes, ofreciendo un rendimiento premium con menos chips y total compatibilidad con el ecosistema de software en el que ya funcionan las empresas», dijo Banghua Zhu, cofundador y CTO de RadixArk.
Por qué las RDUs Intel Xeon 6 y SambaNova
La arquitectura de ingeniería conjunta se centra en procesadores Intel Xeon 6 y RDUs SambaNova. El RDU SN50 está diseñado para cambiar la tokenómica de la inferencia, ofreciendo decodificación de alto rendimiento y baja latencia para grandes modelos de lenguaje, mientras que Xeon 6 proporciona el ancho de banda de memoria, la densidad de carriles PCIe y los aceleradores de idas ondie.
Según las mediciones de SambaNova, Xeon 6 ofrece tiempos de compilación LLVM más del 50% más rápidos en comparación con CPUs de servidor Armbase, y hasta un 70% más rápido en un rendimiento de bases de datos vectoriales en comparación con la competencia disponible basada en x86. Esto acelera los flujos de trabajo de los agentes de codificación de extremo a extremo, permitiendo a los desarrolladores pasar de agentes de ideas a agentes listos para producción de forma notablemente más rápida.
Cuando miles de agentes de codificación simultáneos generan llamadas a herramientas, solicitudes de recuperación, compilaciones de código y mensajes de interagente cifrados, la CPU no es un componente en segundo plano: es la capa ejecutiva y de acción del sistema», dijo Harry Ault, CRO de SambaNova. «Combinar Xeon 6 con las RDUs SambaNova ofrece a las empresas y a los operadores de IA soberanos despliegues más rápidos, rentables y diseñados específicamente para las cargas de trabajo agenticas que se ejecutan en producción hoy en día.»
En este nuevo diseño:
- Las GPUs gestionan la fase de prerellenado altamente paralela, convirtiendo los prompts largos en cachés de valor clave de forma eficiente.
- Las RDUs SambaNova se sitúan junto a Xeon 6 como la tela de inferencia dedicada para la decodificación de alto rendimiento y baja latencia, asegurando que, una vez que las CPUs han configurado el trabajo, los tokens se generen rápida y eficientemente.
- Xeon 6 es la CPU anfitriona y el plano de control del sistema, responsable de la coordinación de tareas agente, la distribución de cargas de trabajo, la ejecución de herramientas y API, y el comportamiento a nivel de sistema, además de servir como la CPU de acción que compila y ejecuta el código y valida los resultados.
Acelerando la siguiente fase de la IA
Este anuncio marca una clara progresión desde la colaboración hasta el despliegue comercial a gran escala, señalando confianza en la tecnología y ofreciendo una solución sólida y competitiva para empresas, proveedores de servicios y plataformas globales en la nube.

