Компанія Tesla сьогодні представила свій новий спеціалізований процесор D1. Рішення призначене для машинного навчання. Процесор проводиться за нормами 7 нм і містить 50 млрд транзисторів. Площа при цьому становить 645 мм 2, що досить багато, хоча і менше, ніж у того ж GPU Nvidia GA100. Tesla D1 оснащений 354 навчальними вузлами на базі 64-розрядного суперскалярного процесора з чотирма ядрами. Рішення підтримує інструкції FP32, BFP16, CFP8, INT32, INT16 і INT8.
Продуктивність в обчисленнях з одинарної точністю (FP32) становить 22,6 TFLOPS, а в разі режиму BF16/CFP8 мова йде про 362 TFLOPS. Такі результати досягаються при TDP 400 Вт. Так як для машинного навчання важлива масштабованість, Tesla розробила спеціалізований інтерфейс з пропускною спроможністю 10 ТБ/с. Кільце введення-виведення включає 576 смуг, кожна з яких має пропускну здатність в 112 Гбіт/с.
В результаті Tesla може збирати чіпи D1 в спеціальні плитки по 25 процесорів в кожній. І такі плитки також можна з’єднувати між собою. Компанія продемонструвала таку плитку з процесорами, що працюють на частоті 2 ГГц. Продуктивність такого рішення склала 9 PFLOPS (BF16/CFP8).
Також у компанії є плани по створенню суперкомп’ютера на основі процесорів D1. Система ExaPOD буде заснована на 120 плитках з 3000 процесорів. Підсумкова продуктивність досягне 1,1 ExaFLOPS (FP16/CFP8). Після завершення будівництва система буде найпотужнішим суперкомп’ютером для навчання ІІ. У порівнянні з нинішніми суперкомпьютерами Tesla на основі GPU Nvidia така система запропонує в чотири рази більшу продуктивність і в 1,3 рази більшу продуктивність на ват при п’ятикратному зниженні займаної площі. Джерело
… [Trackback]
[…] Read More Info here on that Topic: portaltele.com.ua/equipment/computer-hardware/tesla-predstavyla-spetsializovanyj-protsesor-d1.html […]