Меню
Головна Блог компанії De Novo Збоїв у роботі ЦОД стає відносно менше, але обходяться вони все дорожче
Збоїв у роботі ЦОД стає відносно менше, але обходяться вони все дорожче

Збоїв у роботі ЦОД стає відносно менше, але обходяться вони все дорожче

2024-05-06

Помітних інцидентів у роботі датацентрів рік у рік стає дедалі менше і це світова тенденція. Водночас вартість хвилини простою тепер коштує набагато дорожче, ніж раніше. Головними джерелами аварій залишаються електричне обладнання та людський фактор.

Ринок датацентрів зростає, як мінімум, останні десять років, а нещодавно прискорення йому надав також попит на технології AI/ML. Площа і потужність ЦОДів по всьому світі росте, об'єкти на 100 МВт та більше вже не є поодинокими. Разом із попитом на послуги зростає й навантаження на обладнання. Водночас за даними нового дослідження Annual Outage Analysis 2024, проведеного Uptime Institute, в останні кілька років спостерігається тенденція до зниження частоти й важкості збоїв відносно обсягів зростання ІТ-потужностей. Це означає, що хоча в абсолютних цифрах інцидентів побільшало, але темпи їх приросту суттєво нижчі, за обсяги нарощування самих ІТ-ресурсів. Тобто показник відмов у розрахунку на 1 МВт введеної потужності скорочується.

Мільйон за аварію

Однією з причин стало те, що оператори сервісів, комерційні компанії та державні установи стали приділяти більше уваги питанням забезпечення резервування та стійкості до відмов інфраструктури ЦОДів. Водночас фахівці Uptime Institute попереджають, що інформацію про кількість збоїв слід використовувати зважено, бо часто дані про аварії є комерційною таємницею й компанії, що пережили аварії, схильні приховувати наслідки. Проте щорічно у світі фіксується до двох десятків великих аварій, які стали відомі громадськості.

 Источник изображения: Uptime Institute
Джерело: Uptime Institute

 

У звіті є ряд цікавих цифр. Так, за даними Uptime, понад 55 % опитаних операторів повідомили, що за останні три роки в їхніх датацентрах траплялися аварії. Для порівняння — у звіті 2023 таких було 60%, а ще роком раніше — майже 70%. Наявна тенденція до зниження числа інцидентів. Проте 54% респондентів повідомили , що останній за часом великий збій у роботі коштував щонайменше $100 тис., а 16% сказали, що аварія вартувала понад $1 млн.

Найпоширенішим джерелом аварій залишається система електроживлення, відмови якої стали причиною порушень роботи ЦОДів у 52% випадків. У звіті аналітики Uptime дуже обережно натякають на те, що, можливо, до потенційних причин, що знижують надійність енергосистеми, варто віднести перехід на відновлювані джерела енергії та викликану цим «динамічність» (фактично порушення стабільності) електромереж, що живлять датацентри. Зазначається, що значна частина відключень енергії відбувається, коли ДБЖ або ДГУ не встигає зреагувати на збій у зовнішній мережі.

 Источник изображения: Uptime Institute
Джерело: Uptime Institute

 

Характерний приклад такої аварії — минулорічний інцидент у датацентрі Microsoft. Тоді, нагадаємо, через збій у електропостачанні один з ЦОДів оператора перейшов на живлення від генераторів, але не всі ДГУ запрацювали вчасно. В результаті трапився збій у роботі сервісів Azure на території Західної Європи.

Друге за поширеністю джерело аварій — вихід з ладу охолоджувального обладнання. Зі свіжих прикладів — торік через збій системи охолодження в датацентрі Equinix, клієнти банків DBS та Citibank не змогли провести 2,5 млн транзакцій.

Знову цей людський фактор

Незалежно від того, яка інженерна підсистема вийшла з ладу, в основі аварій, найчастіше лежить людський фактор і набагато рідше — об'єктивні причини непереборного характеру. Умисне або випадкове порушення персоналом регламентів, інструкцій та процедур у роботі з обладнанням ЦОД є глибинною причиною збоїв приблизно в трьох випадках з чотирьох.

Не дивно, що на цьому тлі експерти Uptime Institute радять насамперед більш ретельно підходити до питання підбору, навчання та перевірки кваліфікації співробітників, які працюють з обладнанням. Саме тут аналітики вбачають потенціал для суттєвого зниження кількості збоїв.

Нагадаємо, що ЦОД компанії De Novo за більш ніж 15 років роботи не зупинявся ані на хвилину, забезпечуючи клієнтам 100% доступності. Наші досвідчені технічні фахівці регулярно проходять навчання та підтверджують свою кваліфікацію сертифікатами. Якщо вам потрібний надійний безвідмовний ЦОД, а також сучасні хмарні сервіси IaaS та PaaS – звертайтесь до нас по консультацію!

© 2008—2024 De Novo (Де Ново)