Налаштування ПЗ подвоює швидкість обробки комп’ютера, вдвічі зменшує споживання енергії

На 56-му щорічному Міжнародному симпозіумі IEEE/ACM з мікроархітектури дослідники з Каліфорнійського університету в Ріверсайді (UCR) продемонстрували підхід, при якому будь-які обчислювальні компоненти платформи по-справжньому працюватимуть одночасно. За рахунок цього можна вдвічі збільшити швидкість обчислень і вдвічі скоротити споживання енергії. Технологія може працювати на будь-яких процесорах та прискорювачах від смартфонів до серверів ЦОД, але потребує доопрацювання.

«Вам не потрібно [для прискорення обчислень] додавати нові процесори, тому що вони вже є», — сказав Хунг-Вей Ценг (Hung-Wei Tseng), ад’юнкт-професор факультету електротехніки та обчислювальної техніки Каліфорнійського університету та співавтор дослідження. Необхідно лише грамотно розпорядитися наявними апаратними ресурсами, а чи не вибудовувати їх у чергу.

Розроблена дослідниками платформа, яку вони назвали одночасною та гетерогенною багатопоточністю (SHMT), відходить від традиційних моделей програмування. Замість того, щоб надавати за один проміжок часу дані лише одному з обчислювальних компонентів системи — центральному, графічному, тензорному або іншому процесору або прискорювачу, технологія SHMT розпаралелює виконання коду відразу по всіх компонентах одночасно.

SHMT використовує політику планування багатопоточності з урахуванням такого параметра, як quality-aware work-stealing (QAWS), яка не вимагає великих витрат ресурсів, проте допомагає підтримувати контроль якості та баланс робочого навантаження. Система виконання створює та поділяє набір віртуальних операцій (vOPS) на одну або кілька високорівневих операцій (HLOPs) для одночасного використання кількох апаратних ресурсів. Потім система виконання SHMT розподіляє ці HLOPS за чергами завдань для запуску на цільовому устаткуванні. Оскільки HLOPS не залежить від устаткування, система виконання може перенаправляти завдання в міру потреби на той чи інший компонент обчислювальної платформи.

Порівняння методів розпаралелювання звичайного, сучасного гетерогенного та SHMT

Що особливо цінно, дослідники з прикладу створеної ними тестової платформи показали ефективність роботи нових програмних бібліотек. Вони створили гібрид, який можна вважати як смартфоном, так і подобою ПК і навіть сервера. На базі плати, що об’єднує, з роз’ємом PCIe був створений «комп’ютер» з комбінації модуля NVIDIA Nano Jetson з чотириядерним процесором ARM Cortex-A57 (CPU) і 128 графічними ядрами архітектури Maxwell (GPU). Через слот M.2 Key E на платі було підключено прискорювач Google Edge (TPU).

Прискорення обчислень SHMT залежно від обраної політики

Основна пам’ять представленої системи – це 4 Гбайт LPDDR4 із частотою 1600 МГц та швидкістю 25,6 Гбіт/с, де зберігаються загальні дані. Модуль Edge TPU додатково містить 8 Мбайт пам’яті, а як операційну систему використовувався Ubuntu Linux 18.04.

Запуск на імпровізованій гетерогенній платформі пакета SHMT з використанням стандартних додатків для тестування показав, що при найефективнішій політиці фреймворк QAWS показує збільшення швидкості обчислень у 1,95 раза та значне скорочення споживання – на 51 % порівняно з базовим методом розподілу обчислень. Якщо масштабувати цей підхід для використання у складі ЦОД, то виграш обіцяє виявитися колосальним і при цьому все «залізо» залишиться незмінним — міняти нічого не доведеться. Запропоноване рішення поки не готове до впровадження, але напевно легко знайде зацікавлених у цьому осіб.

Exit mobile version