El panorama general: Nvidia ha vuelto a disparar a AMD con nuevos resultados de referencia que muestran el rendimiento superior de sus últimos GPU con los modelos AI de Deepseek. Esto viene después de la reciente publicación de AMD de puntos de referencia que posicionó su Radeon RX 7900 XTX antes de las ofertas de Nvidia.
Nvidia contraataque afirma que su nueva GPU de GeForce RTX 5090 supera El buque insignia de AMD por un margen asombroso. Según Team Green, el RTX 5090 es hasta 2.2 veces más rápido que el RX 7900 XTX cuando se ejecuta modelos Deepseek R1 AI.
El gigante tecnológico realizó extensos puntos de referencia utilizando tres versiones del modelo Deepseek R1 AI: Distill Qwen 7B, Llama 8B y Qwen 32B. Cuando se usa el QWEN LLM con parámetros 32B, NVIDIA informa que el RTX 5090 fue 124 por ciento más rápido que el contendiente de AMD, mientras que el RTX 4090 de generación anterior aún manejó una ventaja del 47 por ciento.
Patrones similares surgieron en otras pruebas. Con Llama 8B, el RTX 5090 superó el RX 7900 XTX en un 106 por ciento, mientras que el RTX 4090 mantuvo una ventaja del 47 por ciento. Incluso en la prueba QWEN 7B, la última oferta de Nvidia fue 103 por ciento más rápida, con el RTX 4090 mostrando una ventaja de rendimiento del 46 por ciento.
Estos resultados contrastan firmemente con los puntos de referencia anteriores de AMD, que habían mostrado el RX 7900 XTX superando el RTX 4090 y 4080 de NVIDIA en la mayoría de los escenarios, con clientes potenciales de hasta 113 por ciento y 134 por ciento, respectivamente.
Nvidia también afirmó que sus GPU de la serie GeForce RTX 50, impulsadas por hasta 3,352 billones de operaciones por segundo de capacidad de procesamiento de IA, están posicionadas de manera única para ejecutar la familia de modelos destilados de Deepseek más rápido que cualquier otra opción en el mercado de PC. Esto se debe a la familia del modelo R1 de Deepseek, que Nvidia describió como parte de una nueva clase de modelos de razonamiento «.
Estos LLM están diseñados para imitar los procesos de resolución de problemas humanos al asignar más recursos computacionales a ‘pensar’ y ‘reflexionar’ sobre temas complejos. Este enfoque, conocido como escala de tiempo de prueba, permite que el modelo asigne dinámicamente recursos informáticos durante la inferencia para razonar a través de problemas de manera más efectiva.
NVIDIA también señaló que sus GPU de la Serie RTX 50, con núcleos de tensor de quinta generación dedicados, se basan en la misma arquitectura de GPU Blackwell que impulsa las innovaciones de IA en los centros de datos. Esta arquitectura permite a RTX acelerar completamente los modelos Deepseek, ofreciendo una eficiencia de inferencia máxima en las computadoras personales.
La compañía también promocionó su plataforma RTX AI, un ecosistema que abre capacidades Deepseek-R1 a más de 100 millones de PC NVIDIA RTX AI en todo el mundo, incluidas las equipadas con las últimas GPU de la Serie GeForce RTX 50.
Nvidia argumentó que las GPU RTX de alto rendimiento aseguran que las capacidades de IA sigan siendo accesibles, incluso sin una conexión a Internet. Esto no solo ofrece baja latencia, sino que también mejora la privacidad, ya que los usuarios pueden evitar cargar materiales confidenciales o exponer sus consultas a los servicios en línea.