NVIDIA está colaborando con Google Cloud para llevar la IA agéntica a las empresas que buscan aprovechar localmente la familia de modelos de IA Google Gemini utilizando las plataformas NVIDIA Blackwell HGX y DGX y NVIDIA Confidential Computing para la seguridad de los datos. Con la plataforma NVIDIA Blackwell en Google Distributed Cloud, los centros de datos locales pueden cumplir los requisitos normativos y las leyes de soberanía de datos bloqueando el acceso a información confidencial, como historiales de pacientes, transacciones financieras e información gubernamental clasificada. NVIDIA Confidential Computing también protege el código sensible de los modelos Gemini frente a accesos no autorizados y fugas de datos.
«Sachin Gupta, vicepresidente y director general de infraestructura y soluciones de Google Cloud, afirma: «Al incorporar nuestros modelos Gemini a las instalaciones con el extraordinario rendimiento y la capacidad de computación confidencial de NVIDIA Blackwell, estamos permitiendo a las empresas liberar todo el potencial de la IA agéntica. «Esta colaboración ayuda a garantizar que los clientes puedan innovar de forma segura sin comprometer el rendimiento o la facilidad operativa.» La computación confidencial con NVIDIA Blackwell proporciona a las empresas la garantía técnica de que las indicaciones de sus usuarios a la interfaz de programación de aplicaciones de los modelos Gemini -así como los datos que utilizaron para el ajuste- permanecen seguras y no pueden verse ni modificarse. Al mismo tiempo, los propietarios de los modelos pueden protegerse contra el acceso no autorizado o la manipulación, proporcionando una protección de doble capa que permite a las empresas innovar con los modelos Gemini manteniendo la privacidad de los datos.
Agentes de IA que impulsan nuevas aplicaciones empresariales
Esta nueva oferta llega en un momento en que la IA agéntica está transformando la tecnología empresarial, ofreciendo capacidades más avanzadas de resolución de problemas. A diferencia de los modelos de IA que perciben o generan basándose en conocimientos aprendidos, los sistemas de IA agéntica pueden razonar, adaptarse y tomar decisiones en entornos dinámicos. Por ejemplo, en el soporte informático empresarial, mientras que un modelo de IA basado en el conocimiento puede recuperar y presentar guías de solución de problemas, un sistema de IA agéntica puede diagnosticar problemas, ejecutar correcciones y escalar problemas complejos de forma autónoma.
Del mismo modo, en finanzas, un modelo de IA tradicional podría señalar transacciones potencialmente fraudulentas basándose en patrones, pero un sistema de IA agéntica podría ir más allá investigando anomalías y tomando medidas proactivas como bloquear transacciones antes de que se produzcan o ajustar las reglas de detección de fraude en tiempo real.
El dilema de las instalaciones
Aunque muchos ya pueden utilizar los modelos con razonamiento multimodal -integrando texto, imágenes, código y otros tipos de datos para resolver problemas complejos y crear aplicaciones de IA agéntica basadas en la nube-, aquellos con estrictos requisitos de seguridad o soberanía de datos aún no han podido hacerlo. Con este anuncio, Google Cloud será uno de los primeros proveedores de servicios en la nube en ofrecer capacidades de computación confidencial para asegurar las cargas de trabajo de IA agéntica en todos los entornos, ya sean en la nube o híbridos.
Gracias a la plataforma NVIDIA HGX B200 con GPU Blackwell y NVIDIA Confidential Computing, esta solución permitirá a los clientes salvaguardar los modelos y datos de IA. Esto permite a los usuarios conseguir un rendimiento y una eficiencia energética extraordinarios sin comprometer la seguridad de los datos ni la integridad de los modelos.
Observabilidad y seguridad para la IA agéntica
El escalado de la IA agéntica en producción requiere una observabilidad y una seguridad sólidas para garantizar un rendimiento y un cumplimiento fiables. Google Cloud ha anunciado hoy un nuevo GKE Inference Gateway creado para optimizar el despliegue de cargas de trabajo de inferencia de IA con enrutamiento y escalabilidad avanzados. Al integrarse con NVIDIA Triton Inference Server y NVIDIA NeMo Guardrails, ofrece un equilibrio de carga inteligente que mejora el rendimiento y reduce los costes de servicio, a la vez que permite la seguridad y gobernanza centralizadas del modelo.
De cara al futuro, Google Cloud está trabajando para mejorar la observabilidad de las cargas de trabajo de IA agéntica mediante la integración de NVIDIA Dynamo, una biblioteca de código abierto creada para servir y escalar modelos de IA de razonamiento a través de fábricas de IA.
Traducción realizada con la versión gratuita del traductor DeepL.com