На начавшемся вчера мероприятии NVIDIA GTC 2017, которое посвящено передовым графическим решениям, глава компании NVIDIA Дженсен Хуанг анонсировал новый флагман – GPU на архитектуре нового поколения Volta под названием GV100.

Как отмечается, этот чип станет основой профессионального ускорителя Tesla V100, а примерно через год после этого заменит GPU GP100 поколения Pascal в будущих видеокартах GeForce 2000 серии. Как предполагается, именно такая конфигурация может появиться в GTX 2080 Ti.

Что касается технических спецификаций, то они поражают. Судите сами – чип содержит 21,1 млрд транзисторов против 15,3 млрд транзисторов у GP100 архитектуры Pascal, имеет площадь 815 мм² против 610 мм² у GP100 и должен выпускаться на мощностях TSMC по 12-нанометровому техпроцессу FF. Pascal выпускается по 16-нанометровому техпроцессу FF.

Но это ещё не всё. Новинка имеет 5376 (!) ядер CUDA, которые разнесены по блокам Volta Streaming Multiprocessor Unit. Каждый блок SM содержит 64 ядра CUDA. Всего таких блоков у GPU 84 (84 x 64 = 5 376). Общее количество текстурных блоков равно 336.

Кроме этого, новинка имеет вычислительные блоки Tensor Cores, которые предназначены для вычислений, связанных с нейросетями, машинным и глубоким обучением в количестве 672 единиц. Разработчики говорят, что один сервер на базе GPU Tesla V100 сможет заменить сотни CPU в высокопроизводительных вычислениях и обеспечит производительность на уровне 120 TFLOPS в задачах глубокого обучения.

Чип будет работать с памятью HBM2, пропускная способность которой составит целых 900 ГБ/с, но её будет всего 16 ГБ, а не 32, как у предыдущей модели.

Также был показан собственно ускоритель Tesla V100 на основе этого GPU. Он имеет количество активных ядер CUDA 5120 и 640 ядер Tensor Cores, но даже при этом он имеет на 42% больше ядер по сравнению с P100.

Графическим ускоритель Tesla V100 способен предложить производительность 15 TFLOPS при вычислениях с одинарной точностью (FP32) и 7,5 TFLOPS – с двойной точностью (FP64). Максимальная частота GPU в данном случае указана равной 1455 МГц. Теплопакет составляет 300 Вт. При этом пока что говорится лишь о форм-факторе Tesla V100 в виде модуля с интерфейсом NVLink второго поколения с пропускной способностью 300 ГБ/с. Но наверняка в будущем выйдет модификация в виде стандартной платы расширения с интерфейсом PCIe.

К сожалению, данных о реальной производительности в играх пока нет.