NVIDIA Pascal GPU 2015

Nuevos detalles sobre NVIDIA Pascal salen a la luz gracias a 3DCenter, mediante Beyond3D, en los que se muestra el total rendimiento de computo de la próxima generación de GPU de NVIDIA basados en FinFET.

Hace apenas unos días os anunciábamos la filtración de cuatro variantes basadas en NVIDIA Pascal hacia el centro de pruebas de NVIDIA en la India, y entre ellas se encontraba el buque insignia conocido como GP100.

Bien, pues gracias a esta nueva información, se han dado a conocer más detalles acerca de la GP100. Esta GPU se basa en el proceso de fabricación de 16nm FinFET, conduciendo a mejoras en la eficiencia y un mayor rendimiento por vatio, pero a diferencia de Maxwell, Pascal ofrece el doble de rendimiento de precisión de cálculo.

Maxwell, la actual arquitectura de NVIDIA, ha hecho grandes avances importantes en el rendimiento por vatio, y se espera que Pascal siga por el mismo camino.

La información actual proviene de diapositivas ya existentes, pero a las que apenas gente tenía acceso a ellas, y fueron descubiertas por iMacmatian, miembro del foro de Beyond3D, el cual ha recopilado una gran lista de dichas diapositivas.

Dado que la mayoría de las diapositivas datan de 2014-2015, es posible que ciertos cambios no se hayan aplicado a la GPU.

En primer lugar, una diapositiva de una presentación de marzo de 2014, detalla los GFLOPs por vatio por cada una de las GPU de NVIDIA.

Claramente, la diapositiva muestra que Pascal tiene una potencia de 14 GFLOPs por vatio, mientras que Volta tiene una potencia de 22 GFLOPs por vatio. También establece que dichas aproximaciones son para doble precisión o DGEMM (Dual Precision Floating General Matrix Multiply) GFLOPs/W y no de precisión simple debido a que Maxwell ha sido eliminada de las ultimas diapositivas ya que no dispone de ningún hardware FP64 en su interior.

Se espera que Pascal pueda llegar a alrededor de 14 GFLOPs/W, siendo más del doble de la doble precisión GFLOPs/W.

Al llegar a la precisión simple o SGEMM (Single Precision Floating General Matrix Multiply) GFLOPs/W se calcula unos 42 GFLOPs para Pascal. Maxwell tiene una potencia de 23 GFLOPs/W, alcanzando los hasta 25 GFLOPs/w en dual-GPU, mientras que Volta tiene una potencia de 73 GFLOPs/W.

Ahora hay una diapositiva que detalla el HGEMM (Half Precision Floating General Matrix Multiply). Sabemos que Pascal y la próxima generación de GPU vendrá con precisión de cálculo mixta permitiendo al usuario obtener el doble de rendimiento en FP16 en cargas de trabajo comparado con FP32, que computa a 16-bit, el doble de precisión que FP32.

Comparado con Maxwell, que solo tiene 26 GFLOPs/W, siendo la mitad de precisión. Pascal tendrá hasta 85 GFLOPs/W, mientras que Volta llegará hasta los 145 GFLOPs/W.

Las diapositivas de 2014 están llenas de información útil sobre Pascal. Por supuesto se tratan de diapositivas presentadas antes de que Pascal entrase en fase de pruebas, sabiendo que en algún momento NVIDIA dio el paso de cambiar su diseño de HMC (Hybrid Cubic Memory) a HBM2, que así fue como se presentó ante el público en la GTC 2015 celebrada en Japón.

HBM2 pasaría a formar parte del chip final, donde NVIDIA habría sido capaz de integrar memorias HBM2 y una GPU de 16nm en el mismo chip, o sería un diseño similar al ya visto en las Fury de AMD, que fusionan la GPU y HBM en una misma interposición que la convierte en un solo chip, similar a una especie de SoC.

Detalles conocidos hasta el momento en la GPU buque insignia GP100 basado en NVIDIA Pascal:

  • Arquitectura de gráficos Pascal.
  • El doble de rendimiento estimado por vatio respecto a Maxwell.
  • Puesta en marcha en 2016, supuestamente durante la segunda mitad de año.
  • DirectX 12 de nivel 12_1 o superior.
  • Sucesora de la GPU GM200, núcleo de la GTX Titan X y GTX 980 Ti.
  • Construido en un proceso de fabricación de 16nm FinFET de TSMC.
  • 17 billones de transistores, más del doble que la GM200.
  • Cuatro pilas 4-Hi HMB2, para un total de 16GB de VRAM y cuatro pilas 8-Hi para hasta 32GB de VRAM para uso profesional.
  • Interfaz de bus de memoria de 4096 bits, al igual que la serie Fury de AMD.
  • Características NVLink.
  • Compatible con la mitad de precisión de computo FP16 con el doble de tasa de precisión completa FP32.

No hay duda de que NVIDIA Pascal también ofrece una gran cantidad de rendimiento destinado a los mercados Tesla y Quadro. Las tarjetas gráficas de próxima generación basadas en FinFET una gran cantidad de potencia para flexionar las complejas tareas en las cargas de trabajo de HPC. Toca esperar al GTC 2016, que traerá una gran cantidad acerca de las soluciones Tesla basadas en Pascal.

Fuente: WCCFTech