PUE вже недостатньо? Підхід до оцінки ефективності ЦОД пропонують переглянути.
2024-06-21
В останні роки середній по галузі показник ефективності використання електроенергії в ЦОДах (PUE) ніби застряг на місці. Тому деякі експерти заговорили про необхідність інших, більш показових метрик, особливо в контексті AI/ML-навантажень.
Багато років поспіль коефіцієнт PUE успішно використовувався (та продовжує використовуватися зараз), для оцінки енергоефективності інфраструктури дата-центрів. Цей показник, нагадаємо, було введено 2007 року консорціумом The Green Grid. Привабливість PUE – у простоті та наочності. Для його розрахунку достатньо розділити загальне фактичне енергоспоживання ЦОДу на енергоспоживання ІТ-обладнання, що у ньому розміщено. Відповідно, що нижчий отриманий коефіцієнт — то ефективніше використовується енергія.
За даними Uptime Institute, у 2007 році середній PUE дата-центрів по світі дорівнював 2,5, потім він став швидко знижуватися й у 2017-2018 роках досяг рівня трохи менше ніж 1,6, де й перебуває досі. Найтехнологічніші ЦОДи забезпечують показник на 1,1-1,2 (іноді навіть менше), але на загальну картину це не дуже впливає — Uptime Institute зазначає, що у 2023 році 16% дата-центрів мали PUE 1,3 та нижче. Зрозуміло, PUE це не єдиний коефіцієнт у своєму роді — всього існує кілька десятків подібних метрик — але, безумовно, найвідоміший з них.
Нові метрики для нових навантажень
В останні кілька років ситуація почала стрімко змінюватися, в основному, через швидкий перехід на сервери для AI/ML-задач. Такі системи створюють величезну питому щільність потужності в ЦОДах (нерідко це десятки кВт на стійку) що призводить до суттєвого зростання споживання всіх інженерних підсистем дата-центру. Але при цьому радикально збільшується ефективність обчислень, особливо на специфічних завданнях, пов'язаних зі штучним інтелектом та машинним навчанням. В результаті, як вважають, наприклад, у NVIDIA — звичний PUE та інші подібні коефіцієнти вже не дають вірного розуміння того, наскільки ефективно використовується електроенергія. Наводячи аналогію, фахівці компанії кажуть, мовляв, це все одно, що оцінювати ефективність автомобіля лише за тим, скільки бензину за одиницю часу витрачає двигун, без урахування того, яку відстань, з яким навантаженням та швидкістю може проїхати машина.
Схожої думки дотримується також сам автор ідеї PUE — Крістіан Беладі, за словами якого: «Сьогодні, коли ЦОДи демонструють коефіцієнт на рівні 1,2, цей показник вже «вичерпав себе». Використання PUE допомогло підвищити ефективність дата-центрів, коли справи були погані, але за пройдешні два десятиліття ситуація покращилася, й нам потрібно зосередитися на інших показниках, більш актуальних для розв'язання сьогоднішніх проблем».
Справді, як зазначили дослідники Стенфордського університету — за останні 20 років, продуктивність прискорювачів обчислень зросла у 7000 разів, співвідношення ціни/продуктивність стало кращим у 5600 разів. Проте за останні 5-7 років у глобальних масштабах зниження PUE майже не відбувається. Така ситуація говорить про те, що для адекватної оцінки ефективності дата-центрів потрібні нові метрики, що враховують характер та результат обчислювальних задач. Також очевидно, що не можна оцінювати різні типи навантажень одними й тими самими інструментами.
Так, у NVIDIA вважають, що у разі, коли в ЦОДі виконуються прикладні задачі AI/ML, то для вірної оцінки енергоефективності можна використовувати метрики MLPerf Inference. Для суперкомп'ютерних обчислень підійде HPL benchmark, з урахуванням продуктивності на ват (flops/watt). Свої метрики повинні отримати й інші ключові напрямки, що використовують потужні акселератори (включаючи навантаження у хмарі — GPU Cloud) для високої задач високої інтенсивності. Які підходи та метрики стануть у підсумку загальноприйнятими — зараз дуже складно визначити, однак у тому, що вони будуть вкрай необхідні, в експертному середовищі мало хто виказує сумніви.
Якщо ви шукаєте сучасний, стійкий до відмов та енергоефективний дата-центр для розміщення ІТ-обладнання або вам потрібні інноваційні хмарні сервіси — й те й інше ви знайдете у De Novo. Ми пропонуємо клієнтам надійний ЦОД, який вже понад 15 років не зупиняє своєї роботи ані на хвилину. Також у нас розгорнуті хмарні сервіси IaaS та інноваційні послуги для AI/ML.
Звертайтесь до нас по консультацію!