NVIDIA Quadro GV100: профессиональный видеоускоритель с 32 ГБ памяти HBM2
В рамках конференции GTC 2018, прошедшей недавно в американском городе Сан-Хосе, NVIDIA представила новый профессиональный графический ускоритель NVIDIA Quadro GV100. Устройство ориентировано на высокопроизводительные рабочие станции. Устройство оснащено графическим чипом Volta GV100, который уже знаком по моделям Tesla V100 и TITAN V. В то же время новинка получила несколько передовых технологий, которые пригодятся разработчиком.
Новинка пришла на смену NVIDIA Quadro GP100, поэтому в таблице сравниваются характеристики двух моделей.
| Модель | NVIDIA Quadro GV100 | NVIDIA Quadro GP100 |
| Ядра CUDA | 5120 | 3584 |
| Текстовые блоки | 320 | 224 |
| ROP | 128 | 128 |
| Частота ядра | 1450 МГц | 1430 МГц |
| Частота памяти | 1700 МГц HBM2 | 1400 МГц HBM2 |
| Шина памяти | 4096 бит | 4096 бит |
| Видеопамять | 32 ГБ | 16 ГБ |
| Производительность FP64 | 7,4 TFLOPS | 5,2 TFLOPS |
| Производительность FP32 | 14,8 TFLOPS | 10,3 TFLOPS |
| Производительность Tensor-вычислений | 118,5 TFLOPS | — |
| Архитектура | Volta | Pascal |
| Техпроцесс | 12 нм FFN | 14 нм |
В состав NVIDIA Quadro GV100 входит 5 120 ядер CUDA и 640 специализированных вычислительных блоков Tensor Cores. Последние созданы для вычислений в сфере нейросетей, машинного и глубинного обучения.
Одной из самых интересных новинок на борту NVIDIA Quadro GV100 стала технология трассировки лучей в реальном времени RTX. По словам представителей NVIDIA, ведущие киностудии и разработчики профессионального программного обеспечения в сфере графики уже взяли на вооружение технологию RTX. К примеру, ее уже начали использовать Autodesk, Disney, Industrial Light and Magic и другие. А первой игрой на ПК с поддержкой трассировки лучей NVIDIA RTX станет Metro Exodus.
Еще одной новостью является переход NVIDIA Quadro GV100 на 12-нм техпроцесс. Ядро NVIDIA GV100 получила 320 блоков TMU, 128 ROP и 640 блоков матричных вычислений (Tensor). Ширина шины памяти — 4 096 бит. Графический чип работает на частоте 1 450 МГц, память HBM2 — на 1 700 МГц.
Производительность новой модели оценивается в 7,4 TFLOPS для операций с числами двойной точности, 14,8 TFLOPS — одинарной, 118,5 TFLOPS — Tensor-вычислений. NVIDIA Quadro GV100 поддерживает разрешения 4 x 4096 x 2160 точек при 120 Гц 4 x 5120 x 2880 точек при 60 Гц и 2 x 7680 x 4320 при 60 Гц. На видеокарте предусмотрено четыре интерфейса DisplayPort 1.4.