Así son los silicios de las nuevas NVIDIA Turing que darán vida a las GeForce RTX
Índice de contenido
Se filtran parte de los datos técnicos de la nueva arquitectura NVIDIA Turing para las nuevas tarjetas gráficas GeForce RTX.
La nueva arquitectura Turing de NVIDIA para las tarjetas gráficas gaming que darán soporte a la tecnología Ray Tracing, es una gran desconocida o lo era, ya que se ha filtrado una parte de la documentación técnica al respecto de esta arquitectura. Según los datos esto es un avance de la documentación que estará disponible a partir del 14 de septiembre. Este avance contiene los datos más interesantes.
Ejecución simultánea de instrucciones en coma flotante e integral (INT32)
Se han añadido las unidades de ejecución INT32 que permite la ejecución de instrucciones y procesos de coma flotante y no flotante en paralelo. Según NVIDIA esta mejora debería aportar una mejora de en torno al 36% con respecto a las operaciones de coma flotante.
La ejecución en paralelo se consigue gracias a una arquitectura unificada para la memoria compartida L1 y el almacenamiento de texturas en la caché de texturas. Segun la compañia los núcleos INT32 / FP32 entre otros sistemas de transmisión multiprocesamiento permiten ‘una mejora en el rendimiento del 50% con respecto a cada núcleo CUDA)
Shading Advancements
- Mesh Shading / Sombreado de malla: nuevo modelo de sombreado para vertex, tesselation, sombreado de geometría (más objetos por escena)
- Variable Rate Shading (VRS) / Sombreado de tasa variable: control del desarrollador sobre las tasas de sombreado (para limitar el sombreado donde no proporciona beneficio visual)
- Texture-Space Sharing / Espacio de textura compartido: almacena los resultados de sombreado en la memoria (no es necesario duplicar el trabajo compartido para los procesos)
- Multi-View Rendering (MVR) / Renderización de múltiples vistas- Extiende el Pascal Single Pass Stereo a múltiples vistas en un solo pase.
Compresión de memoria en la arquitectura Turing
Turing ofrece nuevas tecnicas de compresion para la memoria que evitan la pérdida de calidad. Estas mejoras se consiguen mediante algoritmos ‘de vanguardia’ con respecto a Pascal que ofrecen un ‘aumento del 50% en el ancho de banda efectivo en Turing en comparación con Pascal’
Motor de vídeo y pantalla
Nuevo motor de vídeo especial para soportar DisplayPort 1.4a que da soporte a 8K @ 60Hz. Las nuevas gráficas basadas en Turing soporta dos monitores 8K @ 60Hz mediante DisplayPort o USB-C, incorporando el codec NVENC mejorado que permite codificar H.265 en streaming a 8K @ 30FPS y también el nuevo decodificador NVDEC que soporta HEV YUV444 10/12b HDR, H.264 8K y VP9 10/12 HDR.
NVLINK de dos vías
El silicio TU102 cuenta con dos puertos NVLINK x8 de 2ª Generación mientras que el TU104 ofrece solo un enlace x8. El silicio TU106 no cuenta con soporte NVLINK. Desaparece el conector SLI y la posibilidad de crear configuraciones de más de dos tarjetas gráficas.
Respecto a las características TU102 duplica prácticamente las especificaciones de TU106. El silicio TU104 dispone de un chip que dispone de cuatro TPC por cluster a diferencia de los TU102 y TU106 que disponen de seis TPC por cluster.
NVIDIA TURING GPUs | |||
TU102 | TU104 | TU106 | |
Fabrication Node | 12nm FFN | 12nm FFN | 12nm FFN |
Die Size | 754 mm2 | 545 mm2 | 445 mm2 |
Transistors | 18.6 Billion | 13.6 Billion | 10.6 Billion |
NVIDIA SKU w/ full chip | Quadro RTX 6000 | Quadro RTX 5000 | GeForce RTX 2070 |
GPCs | 6 | 6 | 3 |
TPCs | 36 | 24 | 18 |
SMs | 72 (12 per GPC) | 48 (8 per GPC) | 36 (12 per GPC) |
Tensor Cores | 576 | 384 | 288 |
RT Cores | 72 | 48 | 36 |
FP32 Cores (CUDAs) | 4,608 | 3,072 | 2,304 |
INT32 Cores | 4,608 | 3,072 | 2,304 |
ROPs | 96 | 64 | 64 |
TMUs | 288 | 192 | 144 |
Memory Interface | 384-bit | 256-bit | 256-bit |
L2 Cache | 6144 KB | 4096 KB | 4096 KB |