Las NVIDIA Tesla V100 basadas en Volta, destrozan a las NVIDIA Tesla P100 basadas en Pascal

El sistema NVIDIA DGX-1, basado en las NVIDIA Tesla V100, que cuentan con la nueva arquitectura Volta, ofrece un rendimiento brutal con respecto a las anteriores Tesla P100 basadas en las Pascal.

Hace unos días nos hacíamos eco sobre el inicio de la distribución por parte de NVIDIA de los sistemas basados en las NVIDIA Tesla V100, unas tarjetas destinadas a sistemas de cloud computing, análisis de datos e inteligencia artificial. Sabemos que estas nuevas tarjetas apuntan a ser una solución extremada potente y que ofrece un rendimiento sin precedentes, pero en las últimas horas esto se ha confirmado. Las Tesla V100, basadas en la arquitectura Volta son capaces de destrozar en rendimiento a las Tesla P100, basadas en la arquitectura Pascal.

La arquitectura Volta solamente está disponible para sistemas profesionales, ya que NVIDIA no ha visto necesario lanzar esta arquitectura al mercado, debido a que las gráficas Vega de AMD, son incapaces de hacer sombra a la Pascal de NVIDIA. Las Tesla V100, son una solución profesional que implementa lo mejor de la compañía, empezando por el proceso de fabricación de 12nm, cuenta con la tecnología NVLink 2.0, hace uso de memorias HBM2, dispone de gran cantidad de Tensor Cores para la IA y otras tecnologías, que la hacen una solución extremadamente potente y única.

NVIDIA ha lanzado además una tabla que compara el rendimiento de las P100 y las V100 y la diferencia es notable, muy notable. La mejora en potencia en FP64/FP32, como podemos ver, es del 50%, las memorias HBM2 son un 20% más potentes, tiene un 50% más de memoria caché L2, se mejora en un 90% el ancho de banda del NVLink, aunque los saltos mayores son en la caché L1, que se eleva en un 770%, el DL Training que se eleva en un 1200% y el DL Inferencing aumenta en un 600%, con lo que se ha multiplicado por mucho la potencia de esta solución.

Se ha visto también el primer benchmark de los sistemas NVIDIA DGX-1 basado en las Tesla V100, tanto en la API CUDA como en la API OpenCL. El primer resultado, en OpenCL, da nada menos que 481504 puntos, mientras que en CUDA ofrece una puntuación de 743537, lo cual muestra un rendimiento brutal de este sistema, mucho mayor que otras soluciones en el mercado basadas en las Tesla P100, de incluso el doble de rendimiento o más.

Fuente: wccftech

Salir de la versión móvil