La arquitectura Ada Lovelace de Nvidia presenta un nuevo nivel de rendimiento en la parte superior de la pila, con el RTX 4090 superando al RTX 3090 Ti de la generación anterior en un 52 % en promedio en nuestros puntos de referencia de rasterización y en un 70 % en los puntos de referencia de trazado de rayos, ambos en 4K, naturalmente. . La 4090 ahora se encuentra cómodamente en la parte superior de nuestra jerarquía de referencia de GPU y se clasifica como una de las mejores tarjetas gráficas que existen, al menos si tiene mucho dinero.
Lamentablemente, la reducción del tamaño del 4090 al RTX 4080 es bastante precipitada, ya que reduce el rendimiento en un 23 % para la rasterización y en un 30 % para el trazado de rayos. Bajar otro nivel al nuevo RTX 4070 Ti reduce un 22% más el rendimiento sobre el 4080. Si está siguiendo la pista, y definitivamente nos gusta tomar nota, eso significa que la tarjeta Ada de tercer nivel con la GPU AD104 es más lenta que la anterior. generación 3090 Ti, sin importar las afirmaciones de Nvidia en sentido contrario, que se basan en puntos de referencia que utilizan marcos DLSS 3.
Quizás lo más alarmante con el RTX 4070 Ti es que solo tiene una interfaz de memoria de 192 bits. Todavía tiene 12 GB de memoria GDDR6X, y el gran caché general L2 significa que el bus más estrecho no es un problema, pero las cosas no se ven tan bien cuando miramos las futuras piezas de la serie RTX 40 de nivel inferior como el 4060 y 4050.
Nvidia anunció recientemente la línea completa de GPU para portátiles de la serie RTX 40, desde la RTX 4090 móvil que usa la GPU AD103 (básicamente una 4080 móvil) hasta la RTX 4050 con sonido anémico. Aquí está la lista completa de especificaciones para las partes móviles.
Deslice para desplazarse horizontalmenteEspecificaciones de la GPU para portátiles NVIDIA AdaTarjeta gráficaRTX 4090 para portátilesRTX 4080 para portátilesRTX 4070 para portátilesRTX 4060 para portátilesRTX 4050 para portátilesArquitecturaAD103AD104AD106?AD106?AD107?proceso tecnológicoTSMC 4NTSMC 4NTSMC 4NTSMC 4NTSMC 4NTransistores (miles de millones)45.935,8???Tamaño de la matriz (mm^2)378.6294.5???SMS7658362420Sombreadores de GPU97287424460830722560Núcleos tensoriales3042321449680Trazado de rayos «núcleo»7658362420Reloj de impulso (MHz)1455-20401350-22801230-21751470-23701605-2370Velocidad VRAM (Gbps)18?18?18?18?18?VRAM (GB)1612886Ancho del bus VRAM25619212812896Caché L26448323224ROP11280483232TMU3042321449680TFLOPS FP32 (aumento)28.3-39.720.0-33.911.3-20.09.0-14.68.2-12.1TFLOPS FP16 (FP8)226-318 (453-635)160-271 (321-542)91-160 (181-321)72-116 (145-233)66-97 (131-194)Ancho de banda (GBps)576432288288216TDP (vatios)80-15060-15035-11535-11535-115
Es una apuesta razonablemente segura que la computadora de escritorio RTX 4070 usará el mismo AD104 que la RTX 4070 Ti, solo que con menos SM y shaders. Desktop RTX 4060 Ti, suponiendo que lo obtengamos pronto, puede o no usar AD104; presumiblemente, la única otra opción sería la GPU AD106 utilizada en el móvil 4070/4060. Y eso es un problema.
La generación anterior de RTX 3060 Ti venía con 8 GB de GDDR6 en una interfaz de 256 bits. No estábamos particularmente complacidos con la falta de VRAM, especialmente cuando AMD comenzó a comercializar la RX 6700 XT (y luego la 6750 XT) con 12 GB de VRAM. Básicamente, Nvidia corrigió el RTX 3060 y le dio 12 GB de VRAM, lo que lo convierte en un buen paso adelante del RTX 2060 anterior, e incluso el 2060 finalmente vio modelos de 12 GB, aunque los precios los hicieron poco atractivos.
Ahora estamos hablando de que RTX 4060 probablemente vuelva a 8 GB, y eso apestaría. Ahora hay muchos juegos que pueden exceder los 8 GB de uso de VRAM, y ese número solo aumentará en los próximos años. Pero Nvidia no tiene muchas otras opciones, ya que las capacidades de memoria GDDR6 y GDDR6X superan los 2 GB por canal de 32 bits.
Existe la posibilidad de hacer el modo «clamshell» con dos chips de memoria por canal, uno a cada lado de la PCB, pero esto es muy complicado y no es algo que esperaríamos ver en una GPU convencional. Eso podría impulsar la interfaz de 128 bits hasta 16 GB de VRAM, lo que nuevamente sería extraño dado que las partes de nivel superior como el 4070 Ti solo tienen 12 GB. Aún así, ¡eso me suena mejor que un modelo RTX 4060 de 8GB!
¿Qué pasa con la RTX 4050? Quizás Nvidia se quede con la interfaz de 128 bits en la GPU AD106 y omita el uso de AD107 en una parte de escritorio: eso es básicamente lo que sucedió con el GA107, que se usó casi exclusivamente para la computadora portátil RTX 3050. Pero si intenta usar el AD107 en una computadora de escritorio solo tendría hasta 6 GB de VRAM, nuevamente con VRAM clamshell como una salida potencial.
La misma GPU AD104 se encuentra dentro de la tarjeta de escritorio RTX 4070 Ti de Nvidia, así como en la próxima solución para computadora portátil RTX 4080. (Crédito de la imagen: Tom’s Hardware)
No son solo las habilidades de memoria las que son motivo de preocupación. Dijimos en la revisión de la RTX 4070 Ti que el rendimiento no era malo, pero tampoco sorprendente. Básicamente es una versión más económica de un RTX 3090, con la mitad de VRAM y un menor consumo de energía. El 4070 Ti sobrevive con 60 multiprocesadores de transmisión (SM) y 7680 núcleos CUDA (sombreadores de GPU), bastante más que el RTX 3070 Ti saliente. Pero el AD106 solo podría alcanzar 40 SM, tal vez incluso 36 SM, lo que lo colocaría en un territorio similar al RTX 3060 Ti en cuanto a recuentos de núcleos, dejando solo los relojes de GPU como un impulso de rendimiento.
Ponga estas dos cosas juntas (VRAM insuficiente y aumentos relativamente pequeños en el recuento de sombreadores de GPU) y es probable que veamos mejoras modestas en el rendimiento en comparación con las GPU de la generación Ampere anterior.
Nvidia presentará las mejoras de rendimiento de DLSS 3, que solo se aplican a un subconjunto de juegos y tampoco ofrecen aumentos de rendimiento reales, y las cosas comienzan a verse aún peor. Parte del beneficio de tener una GPU que puede ejecutar juegos a 120 fps hoy en día es que, a medida que los juegos se vuelvan más exigentes, aún podrá hacerlo a 60 fps en la mayoría de los juegos dentro de unos años. Pero, ¿qué sucede cuando esas no son velocidades de cuadro reales?
(Crédito de la imagen: Nvidia)
Supongamos que un juego se ejecuta a 120 fps, cortesía de la tecnología Frame Generation de DLSS 3, con un rendimiento de referencia de 70 fps. Todo está bien por ahora, pero en el futuro, el rendimiento de referencia caerá por debajo de los 40 fps a medida que los juegos se vuelvan más exigentes y, finalmente, caerá por debajo de los 30 fps. Lo que hemos experimentado es que renderizar fotogramas con una velocidad de fotogramas base de menos de 30 fps todavía se ve por debajo de los 30 fps, aunque el monitor recibe el doble de actualizaciones de fotogramas por segundo.
Esta misma lógica también se aplica a velocidades de cuadro más altas, por lo que DLSS 3 a 120 fps con una base de 70 fps seguirá pareciendo 70 fps, incluso si se ve un poco más suave a la vista. La mayoría de las personas no podrán notar la diferencia entre las tasas de entrada a 70 muestras por segundo y las entradas a 120 muestras por segundo. Pero cuando comienzas a caer por debajo de 40, incluso los jugadores no profesionales comienzan a sentir la diferencia.
O, para decirlo sin rodeos: DLSS 3 y Framing no son una panacea. Pueden ayudar a suavizar las imágenes y tal vez mejorar un poco la sensación de los juegos, pero el beneficio no será tan notable como los cuadros reales completamente renderizados con la nueva entrada del usuario, particularmente cuando el rendimiento cae por debajo de 60 fps.
Eso no quiere decir que sea mala tecnología, en realidad es bastante inteligente, y no nos importa que exista. Pero Nvidia debe dejar de comparar las puntuaciones de DLSS 3 con las puntuaciones que no son de DLSS 3 y actuar como si fueran lo mismo. Tome la velocidad de fotogramas base antes de la generación de fotogramas y agregue tal vez 10 a 20 por ciento y así es como se ve un juego, no los 60 a 100 por ciento de fps más altos que mostrarán los puntos de referencia.
Volviendo al asunto que nos ocupa, las futuras GPU de la serie RTX 40 convencionales y económicas sin duda superarán a los modelos existentes en rendimiento puro y también admitirán DLSS 3. Con suerte, Nvidia volverá a precios más cercanos a la generación anterior porque si RTX 4060 tiene un precio de $ 499 y el RTX 4050 tiene un precio de $ 399, terminarán siendo actualizaciones menores en comparación con las tarjetas existentes en estos puntos de precio.