На початок вчора заході NVIDIA GTC 2017, яке присвячене передовим графічним рішенням, глава компанії NVIDIA Дженсен Хуанг анонсував новий флагман – GPU на архітектурі нового покоління Volta під назвою GV100.

Як наголошується, цей чіп стане основою професійного прискорювача Tesla V100, а приблизно через рік після цього замінить GPU GP100 покоління Pascal в майбутніх відеокартах GeForce серії 2000. Як передбачається, саме така конфігурація може з’явитися в GTX 2080 Ti.

Що стосується технічних характеристик, то вони вражають. Судіть самі – чіп містить 21,1 млрд транзисторів проти 15,3 млрд транзисторів у GP100 архітектури Pascal, має площу 815 мм2 проти 610 мм2 у GP100 і повинен випускатися на потужностях TSMC за 12-нанометровому техпроцесу FF. Pascal випускається по 16-нанометровому техпроцесу FF.

Але це ще не все. Новинка має 5376 (!) ядер CUDA, які рознесені по блокам Volta Streaming Multiprocessor Unit. Кожен блок SM містить 64 ядра CUDA. Всього таких блоків у GPU 84 (84 x 64 = 5 376). Загальна кількість текстурних блоків одно 336.

Крім цього, новинка має обчислювальні блоки Tensor Cores, які призначені для обчислень, пов’язаних з нейромережами, машинним і глибоким навчанням у кількості 672 одиниць. Розробники кажуть, що один сервер на базі GPU Tesla V100 зможе замінити сотні CPU у високопродуктивних обчисленнях і забезпечить продуктивність на рівні 120 TFLOPS в задачах глибокого навчання.

Чіп буде працювати з пам’яттю HBM2, пропускна здатність якої складе цілих 900 ГБ/с, але її буде всього 16 ГБ, а не 32, як у попередньої моделі.

Також був показаний власне прискорювач Tesla V100 на основі цього GPU. Він має кількість активних ядер CUDA 5120 і 640 ядер Tensor Cores, але навіть при цьому він має на 42% більше ядер порівняно з P100.

Графічний прискорювач Tesla V100 здатний запропонувати продуктивність 15 TFLOPS при обчисленнях з одинарною точністю (FP32) і 7,5 TFLOPS – з подвійною точністю (FP64). Максимальна частота GPU в даному випадку вказана рівній 1455 МГц. Теплопакет становить 300 Вт. При цьому поки що йдеться лише про форм-факторі Tesla V100 у вигляді модуля з інтерфейсом NVLink другого покоління з пропускною спроможністю 300 ГБ/с. Але напевно в майбутньому вийде модифікація у вигляді стандартної плати розширення з інтерфейсом PCIe.

На жаль, даних про реальну продуктивність в іграх поки немає.