Los nuevos desarrollos en la arquitectura de GPU se centran en maximizar la eficiencia del rendimiento para cargas de trabajo de gaming, impulsados por la tercera generación de Xe-core y la nueva arquitectura Xe 2. Estas innovaciones buscan ofrecer una experiencia más consistente, incorporando tanto mejoras de hardware como optimizaciones de software de plataforma.
Arquitectura de GPU de Alto Rendimiento (High-performance GPU IP)
La arquitectura de la GPU ha sido optimizada desde el motor hasta el slice. Las mejoras clave incluyen:
- Aumento del L1$/SLM compartido en un +33%.
- Integración de 8 motores Vectoriales de 512 bits y 8 motores XMX de 2048 bits.
- Mejoras en las funciones fijas GFX y un NUEVO gestor URB.
- Aumento de hasta 2x en el filtrado anisotrópico.
Además, la arquitectura Xe 2 muestra mejoras relativas significativas en el rendimiento por frecuencia de reloj, incluyendo:
- Hasta 2x la tasa de prueba de stencil.
- Un aumento de 7.4x en High Register Pressure Shader.
- Aumento de 2.4x en la intersección Rayo-Triángulo (Ray-Triangle Intersection).
- Mejoras de 2.0x en GEMMs y FP32/INT32 Rate.
El motor vectorial Xe también ha visto incrementos en la utilización, permitiendo hasta un 25% más de threads, con soporte para desquantización FP8 y asignación variable de registros (Variable register allocation). El trazado de rayos (ray tracing) se ha mejorado con una unidad mejorada y gestión dinámica de rayos para el ray tracing asíncrono.
Smart Rendering: Generar Más, Renderizar Menos
La estrategia de Smart Rendering tiene como objetivo principal «Renderizar menos, generar más». Este enfoque incluye la renderización híbrida (ray tracing + raster) y la renderización híbrida con IA.
La tecnología XeSS (Xe Super Resolution) es fundamental en este sistema, ya que todos los píxeles en pantalla son generados. XeSS proporciona varias funciones:
- XeSS Super Resolution (SR): Enfocada en el rendimiento.
- XeSS Frame Generation (FG): Enfocada en la fluidez (smoothness).
- Xe Low latency: Enfocada en la capacidad de respuesta (responsiveness).
La tecnología está evolucionando, mencionándose XeSS 2 y XeSS 3 con XeSS-MFG (Multi-Frame Generation). La generación de cuadros utiliza marcos interpolados, reproyección de vectores de movimiento (Motion vectors) y reproyección de flujo óptico (Optical flow reprojection).
Optimización y Sintonización de Plataforma (Platform Tuning)
Las optimizaciones de plataforma están diseñadas para maximizar la eficiencia y reducir problemas como el tartamudeo (stuttering).
- Gestión de Energía y Frecuencia: Se implementa la sugerencia de frecuencia de reloj (Clock frequency hinting) y el equilibrio de frecuencia de reloj (Clock frequency balancing) para maximizar la eficiencia en cargas de trabajo de gaming. Se utiliza un nuevo algoritmo basado en velocidad y se prioriza la programación E-cores-first (en Panther Lake). Estos cambios buscan dar más margen a configuraciones de GPU más grandes.
- Optimización de Sombras (Shaders): El sistema de Platform Tuning incluye la recopilación de shaders de juegos, su construcción, y actualizaciones automáticas de la caché de shaders a través del almacenamiento en la nube de Intel y servicios de distribución de gráficos. Esto resulta en tiempos de lanzamiento optimizados y una reducción del tartamudeo en el primer lanzamiento.
Estas optimizaciones han demostrado un 10% más de FPS y un 25% mejor en los percentiles 99, y están diseñadas para mejorar los mínimos de rendimiento (1% y 0.1% lows). Estos avances se enfocan en plataformas como Panther Lake y Lunar Lake.