Al utilizar este sitio, acepta la Política de privacidad y Terms y Condiciones.
Aceptar
MastekHwMastekHwMastekHw
  • Noticias
  • Tecnología
    Tecnología
    Todas las noticias más importantes de la tecnología la encuentras aquí en MastekHw, Categoría Tecnología, noticias, lanzamientos, entrevistas y más.
    Ver más
    Noticias Destacadas
    Huawei Nova 14: ¿Sigue siendo una opción sólida en 2026?
    Huawei Nova 14: ¿Sigue siendo una opción sólida en 2026?
    hace 4 semanas
    [COMPUTEX 2025] MSI presenta nuevos productos
    [COMPUTEX 2025] MSI presenta nuevos productos
    hace 9 meses
    Intel y SoftBank Revolucionan la IA con la Nueva Tecnología "Z-Angle Memory"
    Intel y SoftBank Revolucionan la IA con la Nueva Tecnología «Z-Angle Memory»
    hace 4 semanas
    Últimas Noticias
    vivo presentará el X300 Ultra en el Mobile World Congress 2026
    hace 1 día
    Chainalysis presentó el Informe de Crimen Cripto 2026
    hace 2 días
    OpenAI Codex y Figma lanzan una experiencia integrada de código a diseño
    hace 2 días
    OPPO A6 Pro 5G llega a Colombia con batería de 6.500 mAh
    hace 2 días
  • Móviles
    MóvilesVer más
    HUAWEI presentó en Madrid sus innovaciones de vanguardia
    HUAWEI presentó en Madrid sus innovaciones de vanguardia
    7 Min en Leer
    MWC 2026: HONOR un adelanta integración de sus equipos con ecosistema de Apple
    3 Min en Leer
    Claro Colombia inicia la preventa del Samsung Galaxy S26
    Claro Colombia inicia la preventa del Samsung Galaxy S26
    1 Min en Leer
    Empresas europeas logran el primer Edge Continuum federado paneuropeo en el MWC 2026
    Empresas europeas logran el primer Edge Continuum federado paneuropeo en el MWC 2026
    6 Min en Leer
    Kaspersky alerta por nuevo malware en dispositivos Android
    Kaspersky alerta por nuevo malware en dispositivos Android
    6 Min en Leer
  • PC
  • Gaming
  • Reviews
  • Guardados
  • Contacto
Buscar
  • Contacto
  • Blog
  • Publicidad
© 2018 MastekHw Service International. LLc. Todos los derechos reservados.
Leyendo: NVIDIA ahora usa menos VRAM en Stable Diffusion
Compartir
Notificación
Tamaño TextoAa
MastekHwMastekHw
Tamaño TextoAa
  • Noticias
  • Tecnología
  • Móviles
Buscar
  • Categorias
    • Noticias
    • Tecnología
    • PC
    • Móviles
    • Entretenimiento
    • Gaming
    • Reviews
Síguenos
  • Contacto
  • Blog
  • Publicidad
© 2018 MastekHw Service International. LLc. Todos los derechos reservados.
MastekHw > Noticias > Noticias > NVIDIA ahora usa menos VRAM en Stable Diffusion
NoticiasTecnología

NVIDIA ahora usa menos VRAM en Stable Diffusion

Carlos Cantor
Última actualización: junio 23, 2025 5:46 pm
Carlos Cantor
Compartir
NVIDIA ahora usa menos VRAM en Stable Diffusion
Compartir

La IA generativa ha transformado la forma en que las personas crean, imaginan e interactúan con el contenido digital. A medida que los modelos de IA siguen aumentando en capacidad y complejidad, requieren más VRAM (memoria de acceso aleatorio para vídeo). El modelo base Stable Diffusion 3.5 Large, por ejemplo, utiliza más de 18 GB de VRAM, lo que limita el número de sistemas que pueden ejecutarlo correctamente.

Al aplicar la cuantificación al modelo, las capas no críticas pueden eliminarse o ejecutarse con menor precisión. La serie NVIDIA GeForce RTX 40 y la generación Ada Lovelace de GPU NVIDIA RTX PRO admiten la cuantificación FP8 para ayudar a ejecutar estos modelos y la última generación de GPU NVIDIA Blackwell también añade compatibilidad con FP4.

NVIDIA colaboró con Stability AI para cuantificar su último modelo, Stable Diffusion (SD) 3.5 Large, a FP8, lo que redujo el consumo de VRAM en un 40 %. Las optimizaciones adicionales de SD3.5 Large y Medium con el kit de desarrollo de software (SDK) NVIDIA TensorRT duplican el rendimiento.

Además, TensorRT se ha rediseñado para los PC con IA RTX, combinando su rendimiento líder en el sector con la creación de motores en el dispositivo justo a tiempo (JIT, Just In Time) y un tamaño de paquete 8 veces más pequeño para una implementación fluida de la IA en más de 100 millones de PCs con IA RTX. TensorRT para RTX ya está disponible como SDK independiente para desarrolladores.

IA acelerada por RTX

NVIDIA y Stability AI están mejorando el rendimiento y reduciendo los requisitos de VRAM de Stable Diffusion 3.5, uno de los modelos de imágenes de IA más populares del mundo. Con la aceleración y cuantificación de NVIDIA TensorRT, los usuarios ahora pueden generar y editar imágenes de forma más rápida y eficiente en las GPU NVIDIA RTX.

Para solucionar las limitaciones de VRAM del SD3.5 Large, el modelo se cuantificó con TensorRT a FP8, lo que redujo los requisitos de VRAM en un 40 %, hasta los 11 GB. Esto significa que ahora cinco modelos de GPU GeForce RTX serie 50 pueden ejecutar el modelo desde la memoria, en lugar de solo uno.

Los modelos SD3.5 Large y Medium también se optimizaron con TensorRT, un backend de IA para aprovechar al máximo los Tensor Cores. TensorRT optimiza el peso y gráficos de un modelo (las instrucciones sobre cómo ejecutar un modelo) específicamente para las GPU RTX.

En conjunto, FP8 TensorRT ofrece un aumento del rendimiento de 2,3 veces en SD3.5 Large en comparación con la ejecución de los modelos originales en BF16 PyTorch, al tiempo que utiliza un 40 % menos de memoria. Y en SD3.5 Medium, BF16 TensorRT proporciona un aumento del rendimiento de 1,7 veces en comparación con BF16 PyTorch. Los modelos optimizados ya están disponibles en la página Hugging Face de Stability AI.

NVIDIA y Stability AI también están colaborando para lanzar SD3.5 como un microservicio NVIDIA NIM, lo que facilitará a los creadores y desarrolladores el acceso y la implementación del modelo para una amplia gama de aplicaciones. Se espera que el microservicio NIM se lance en julio.

Lanzamiento de TensorRT para RTX SDK

Anunciado en Microsoft Build, y ya disponible como parte del nuevo marco Windows ML en versión preliminar, TensorRT para RTX ya está disponible como SDK independiente para desarrolladores.

Anteriormente, los desarrolladores tenían que pre-generar y empaquetar motores TensorRT para cada clase de GPU, un proceso que permitía obtener optimizaciones específicas para cada GPU, pero que requería mucho tiempo.

Con la nueva versión de TensorRT, los desarrolladores pueden crear un motor TensorRT genérico optimizado para el dispositivo en cuestión de segundos. Este enfoque de compilación JIT (Just In Time) se puede realizar en segundo plano durante la instalación o cuando se utiliza la función por primera vez.

Drimer AI anuncia su llegada a México
Coppel acerca la tecnología a millones de mexicanos a través del crédito
Adrenalin AI Bundle ya está disponible
ManpowerGroup presenta tendencias laborales en 2025
Konk Marketing revela que las compras se hacen después de fechas especiales
ETIQUETADO:Ada LovelaceGPU NVIDIA RTX PROIA generativaJust In TimeNvidiaNVIDIA GeForce RTX 40NVIDIA TensorRTStability AIStable DiffusionStable Diffusion 3.5 LargeTensor CoresVRAM
Comparte este artículo
Facebook Copiar enlace
Compartir
Artículo anterior Parche 7.3 llega a FINAL FANTASY XIV Online en agosto Parche 7.3 llega a FINAL FANTASY XIV Online en agosto
Siguiente Artículo Coinscrap Finance llega a la lista AIFinTech100 2025 Coinscrap Finance llega a la lista AIFinTech100 2025
- Publicidad -
Ad imageAd image

Síguenos

FacebookSeguir Fb
XSeguir
InstagramSeguir
YouTubeSuscríbete
TikTokSeguir
LinkedInSeguir

Últimas noticias

vivo presentará el X300 Ultra en el Mobile World Congress 2026
vivo presentará el X300 Ultra en el Mobile World Congress 2026
Noticias Tecnología
Chainalysis presentó el Informe de Crimen Cripto 2026
Chainalysis presentó el Informe de Crimen Cripto 2026
Noticias Tecnología
The Comeback regresa el 22 de marzo a HBO Max
The Comeback regresa el 22 de marzo a HBO Max
Entretenimiento Noticias
OpenAI Codex y Figma lanzan una experiencia integrada de código a diseño
OpenAI Codex y Figma lanzan una experiencia integrada de código a diseño
Noticias Tecnología

Te puede interesar...

KRAFTON presenta su nueva visión corporativa centrada
GamingNoticias

KRAFTON presenta una nueva visión corporativa

Carlos Cantor
Carlos Cantor
4 Min en Leer
Servinformación está presente en el Centro de Innovación Bogotá
NoticiasTecnología

Servinformación está presente en el Centro de Innovación Bogotá

Carlos Cantor
Carlos Cantor
2 Min en Leer
PRO X TKL RAPID es anunciado por Logitech G
Noticias

PRO X TKL RAPID es anunciado por Logitech G

Carlos Cantor
Carlos Cantor
2 Min en Leer
//

Somos el portal donde obtendrás las novedades sobre tecnología y entretenimiento digital

Enlaces Rápido

  • Contacto
  • Blog
  • Publicidad

Soporte

  • Términos y Condiciones
  • Política de cookies
  • Política de Privacidad

Suscríbete a nuestro boletín

Suscríbase a nuestro boletín para recibir nuestros artículos más recientes.

MastekHwMastekHw
Síguenos
© 2018 MastekHw Service International. LLc. Todos los derechos reservados.
Bienvenido de nuevo!

Accede a tu cuenta

Usuario o Email
Contraseña

¿Ha perdido su contraseña?