GPU як сервіс — із ніші в тренди
2025-01-29
Хмарні послуги GPU as a Service стрімко стають популярними по всьому світі. Головна причина зростання інтересу – неймовірний попит на технології AI/ML, які вже неможливо уявити без потужних акселераторів. До того ж найчастіше вигідніше орендувати потужності «на вимогу», ніж створювати власну систему.
Ще буквально рік-два тому термін GPU as a Service (надання ресурсів прискорювачів обчислень з хмари) не полишав вузького кола спеціалістів. Проте, в останній час глобальний ІТ-ландшафт зазнав суттєвих змін, головним трендом стали ШІ-технології, для реалізації яких потрібні величезні обчислювальні потужності, що їх можуть забезпечити лише графічні прискорювачі (GPU), точніше їх різновид — моделі з тензорними ядрами (TPU). Найбільші світові оператори хмар почали наввипередки надавати клієнтам різні сервіси класу «GPU на вимогу» (GPUaaS, GaaS) Україна, до речі, в цьому відношенні теж не пасе задніх — на початку минулого року De Novo першою у країні вивела на ринок низку хмарних послуг на базі найпотужніших TPU Nvidia H100 та L40S. Прогрес йде майже синхронно в більшості частин світу й тенденція набирає обертів.
GaaS з приватної хмари
Спочатку трохи ринкової інформації. За даними аналітичних досліджень, глобальний ринок GaaS (для стислості будемо використовувати таку абревіатуру) суттєво зріс. Якщо у 2023 році його обсяг оцінювався у $6,4 млрд, то за підсумками 2024 року цей показник перевищив $9 млрд. Позитивна динаміка прогнозується в сегменті як мінімум на найближчі вісім років, при цьому середньорічний приріст очікується на рівні близько 30%. Це означає, що до 2032 року обсяг ринку складе близько $74 млрд.

При цьому, як зазначає аналітична компанія Canalys, зростає кількість організацій, яким доводиться переглядати свої підходи до використання та розвитку робочих навантажень. Це пов'язано зі зростаючими вимогами до ІТ-інфраструктур у контексті нових ШІ-задач. Компанії все частіше стикаються з характерною дилемою, якому рішенню надати перевагу — власному дата-центру, колективному хмарному сервісу або приватній хмарі оператора. Й дедалі більше аргументів з'являється на користь останнього варіанту. Створення власного ЦОД, організація та підтримка в ньому сучасної апаратно-програмної інфраструктури для AI/ML — дуже складне й часто невиправдано дороге завдання для більшості компаній.
Ресурси публічної хмари вигідно використовувати на етапі навчання ML-моделі, але при переході до її комерційної експлуатації витрати можуть зрости не прогнозовано. Приватна хмара GaaS з TPU-прискорювачами дає необхідний баланс, хоча й вона не позбавлена недоліків, головним з яких є менша, порівняно з колективною хмарою, гнучкість варіювання ресурсами «на вимогу» (крок збільшення/зменшення у приватній хмарі помітно більший). Однак, для компаній, які використовують ШІ-рішення, як інструмент бізнесу, приватні майданчики є, мабуть, оптимальним рішенням.
Виступаючи на форумі Canalys Forum EMEA, який проходив цього року в Берліні, Аластер Едвардс, головний аналітик Canalys зазначив: «Майже жодна організація сьогодні не хоче будувати власний локальний ЦОД, але при цьому всі прагнуть забезпечити контроль, суверенітет, безпеку даних та відповідність нормативним вимогам. Водночас замовники не хочуть розв'язувати питання, пов'язані з вимогами, які що далі тим більше зростають, до електричної потужності та систем охолодження обладнання в дата-центрах».
Остання теза стосується наявних локальних ЦОД організацій, більшість з яких просто неможливо перепрофілювати під ШІ-навантаження, особливо з урахуванням майбутніх вимог. Тому, попит на приватні хмари з сервіс-провайдерів з GPU (TPU) продовжує зростати.
Універсальне рішення для багатьох галузей
Поява на ринку масових й дуже потужних акселераторів насамперед від компанії Nvidia істотно змінили правила гри на світовому ІТ-ринку. Такі моделі, як Nvidia A100, H100, L40S та низка інших на основі тензорних та CUDA процесорів дозволили здійснити довгоочікуваний прорив у сфері ШІ, де високопродуктивні обчислення відіграють провідну роль. Сьогодні саме Nvidia контролює понад 95% світового ринку GPU/TPU для дата-центрів, але у 2024 конкурентні моделі почали пропонувати AMD, Intel та деякі інші виробники. Гегемонії лідера поки ніщо не загрожує, але активність інших компаній не дозволить Nvidia спочивати на лаврах й стимулюватиме до розробок нових рішень, що, зрештою, добре для замовників.
Ще однією актуальною технологічною тенденцією останнього року стало посилення інтеграції GaaS з фреймворками штучного інтелекту. Все більше замовників хочуть отримати не просто достатні обчислювальні потужності, а скоріше комплексну платформу PaaS для розробки, тестування, розгортання та експлуатації власних програм на основі ШІ. Інтеграція GPU та фреймворків прискорює процеси навчання та виведення AI/ML-рішень на ринок, сприяючи прогресу у додатках штучного інтелекту для різних секторів.
Цікаво поглянути й на те, як та для яких цілей переважно використовувалися сервіси GaaS у 2024 році. У широкому сенсі це, звичайно ж завдання, пов'язані з AI/ML. Серед найбільш актуальних напрямів – навчання великих мовних моделей (Large Language Models, LLM) та систем розпізнавання зображень. Перші активно використовуються бізнесом для чат-ботів та експертних (рекомендаційних) систем, що працюють у режимі реального часу. Робота із зображеннями широко застосовується для завдань машинного зору, наприклад, розпізнавання осіб та об'єктів системами ідентифікації, охоронного відеоспостереження та умовного доступу.
Вагому частину ринку зайняли завдання, пов'язані з індустрією геймінгу — хмарні ресурси використовуються не тільки для розробки, а й безпосередньо для ігор. Багато користувачів не можуть дозволити собі професійні відеокарти для ресурсомістких застосунків, але цілком здатні орендувати їх на якийсь час в рамках хмарної ігрової платформи, оснащеної GPU. Такий підхід зробив ресурсомісткі ігри доступнішими й водночас створив, фактично, нову ринкову нішу.

У галузі розваг та професійних ЗМІ сервіси GaaS набули широкого поширення для рендерингу відео, створення спецефектів та іншого візуального контенту. Хмарні GPU допомагають скоротити терміни випуску медіапродуктів та реалізувати нові креативні підходи до його створення.
Хмарні прискорювачі дедалі глибше проникають також у сферу біології, медицини та охорони здоров'я. Окрім суто наукових завдань, на кшталт моделювання процесів згортання білків та проведення геномних досліджень, ШІ суттєво прискорює процес створення та виведення на ринок нових ліків, а також суттєво підвищує якість обробки та аналізу медичних зображень (знімки КТ, МРТ). Останній аспект виводить медичну діагностику фактично на новий рівень ефективності.

Значний попит у 2024 році мали GaaS сервіси й у фінансовій галузі. Банки та фінтех-компанії використовували потужності хмарних GPU для виявлення шахрайства в реальному часі, запобігання атакам хакерів, моделювання ризиків, а також для високочастотної торгівлі.
В автомобільній галузі хмарні GPU застосовували, наприклад, для навчання ML-моделей автономних транспортних засобів, обробки даних датчиків у режимі реального часу, картографування та пошук оптимального шляху на основі даних лідара. З інших актуальних напрямів для застосування GaaS варто відзначити Інтернет речей (IoT), «периферійні обчислення» (edge computing), наукові дослідження (моделювання фізичних явищ, біоінформатика, епідеміологія, розробка передових алгоритмів у криптографії тощо).

Завдяки універсальності сервіси GaaS стали незамінним рішенням буквально у всіх галузях економіки, що вимагають високопродуктивних обчислень й технологій AI/ML. Проте, схоже, тенденція ще далека від максимуму розвитку, а отже, 2025 рік принесе ще багато цікавого у сфері хмарних GPU — як з технологічного, так й з ринкового погляду.
Якщо ви плануєте долучитися до світових перегонів у галузі ШІ-технологій або вже це зробили, то без GPU/TPU вам, швидше за все, не обійтися, а отримати доступ до надійної, продуктивної, інфраструктури GaaS, що масштабується, можна вже сьогодні в хмарі De Novo. Ми пропонуємо, зокрема, ресурси найпотужніших TPU NVIDIA H100 та L40S безпосередньо з оточення Kubernetes – у складі нових хмарних послуг Tensor Cloud (у колективній хмарі) та HTI (сервіс класу GPU Private Cloud), а з PaaS-платформою ML Cloud ви отримуєте ще й готове робоче середовище для ML-інженера (класу AWS SageMaker або Google Vertex AI).
Бажаєте дізнатися більше? Звертайтесь по детальну консультацію до наших експертів! Вони не лише нададуть відповіді на ваші запитання, але й допоможуть розгорнути пілотний проєкт або перенести навантаження в хмару De Novo.