Меню
Главная Блог компании De Novo GPU как сервис — из ниши в тренды
GPU как сервис — из ниши в тренды

GPU как сервис — из ниши в тренды

2025-01-29

Облачные услуги GPU as a Service стремительно набирают популярность во всем мире. Главная причина роста интереса — неимоверный спрос на технологии AI/ML, которые уже немыслимы без мощных акселераторов. К тому же зачастую гораздо выгоднее арендовать мощности «по требованию», чем создавать собственную систему.

Еще буквально год-два назад термин GPU as a Service (предоставление ресурсов ускорителей вычислений из облака) не выходил за рамки обсуждения узкого круга специалистов. Но, за последнее время глобальный ИТ-ландшафт претерпел радикальные изменения, главным трендом стали ИИ-технологии, для реализации которых требуются огромные вычислительные мощности, которые могут обеспечить только графические ускорители (GPU), точнее, их разновидность — модели с тензорными ядрами (TPU). Крупнейшие мировые операторы облаков стали наперегонки предоставлять клиентам различные сервисы класса «GPU по требованию» (GPUaaS, GaaS). Украина, кстати, в этом отношении тоже не отстает — в начале прошлого года De Novo первой в стране вывела на рынок целый спектр облачных услуг на базе мощнейших TPU Nvidia H100 и L40S. Прогресс идет почти синхронно в большинстве частей света и тенденция лишь набирает обороты.

Частное облако — разумный баланс

Для начала немного рыночной информации. По данным аналитических исследований, глобальный рынок GaaS (для краткости будем использовать здесь такую аббревиатуру) существенно вырос. Если в 2023 году его объем оценивался в $6,4 млрд, то по итогам 2024 этот показатель превысил $9 млрд. Позитивная динамика прогнозируется в этом сегменте как минимум на ближайшие 8 лет, при этом среднегодовой прирост ожидается на уровне около 30%. Это значит, что к 2032 году объем рынка составит около $74 млрд. Рост будет поддержан спросом в таких отраслях, как здравоохранение, финансы, онлайн-игры, автомобилестроение, медиа и развлечения, которым требуются большие объемы специализированных вычислений для AI/ML-задач.

Singtel on LinkedIn: #gpuaas #singapore #southeastasia #ai #singtel  #aicomputing #datacentres…

При этом, как отмечает аналитическая компания Canalys, растет число организаций, которым приходится пересматривать свои подходы к использованию и развитию рабочих нагрузок. Это связано с растущими требованиями к ИТ-инфраструктурам в контексте новых ИИ-задач. Компании все чаще сталкиваются с характерной дилеммой, что предпочесть — собственный дата-центр, публичный облачный сервис или частное облако у оператора. И чем дальше, тем больше аргументов появляется в пользу последнего варианта. Создание собственного ЦОД, организация и поддержка в нем современной аппаратно-программной инфраструктуры для AI/ML — очень сложная и, зачастую, неоправданно дорогая задача для большинства компаний.

Ресурсы публичного облака хороши на этапе обучения ML-модели, но при переходе к ее коммерческой эксплуатации, затраты могут вырасти не прогнозируемо. Частное облако GaaS с TPU-ускорителями дает необходимый баланс, хотя и оно не лишено недостатков, главным из которых является меньшая, по сравнению с коллективным облаком, гибкость варьирования ресурсами «по требованию» (шаг увеличения/уменьшения в частном облаке заметно больше). Тем не менее, для компаний, которые используют ИИ-решения, как инструмент бизнеса, частные площадки видятся наиболее оптимальным решением.

Выступая на форуме Canalys Forum EMEA, который проходил в этом году в Берлине, Аластер Эдвардс, главный аналитик Canalys отметил: «Почти ни одна организация сегодня не хочет строить собственный локальный ЦОД, но при этом все хотят обеспечить контроль, суверенитет, безопасность данных и соответствие нормативным требованиям. В то же время заказчики не хотят решать вопросы, связанные с быстрорастущими требованиями к электрической мощности и системам охлаждения оборудования в дата-центрах».

Последний тезис относится к существующим локальным ЦОД организаций, большинство из которых просто невозможно перепрофилировать под ИИ-нагрузки, особенно, с учетом будущих требований. Поэтому, спрос на частные облака сервис-провайдеров с GPU (TPU) продолжает расти во всем мире.

Универсальный ответ на многие вопросы

Появление на рынке массовых и очень мощных акселераторов, в первую очередь, от компании Nvidia существенно изменили правила игры на мировом ИТ-рынке. Такие модели, как Nvidia A100, H100, L40S и ряд других на основе тензорных и CUDA процессоров позволили совершить долгожданный прорыв в сфере ИИ, где высокопроизводительные вычисления играют ключевую роль. На данный момент именно Nvidia контролирует свыше 95% мирового рынка TPU для дата-центров, но в 2024 году конкурентные модели начали предлагать AMD, Intel и некоторые другие производители. Гегемонии лидера, пока, ничто не угрожает, но активность других компаний не позволит Nvidia почивать на лаврах и будет стимулировать к разработкам новых решений, что, в конечном итоге, хорошо для заказчиков.

Еще одной актуальной технологической тенденцией последнего года стало усиление интеграции GaaS с фреймворками искусственного интеллекта. Все больше заказчиков хотят получить не просто достаточные вычислительные мощности, а скорее комплексную платформу PaaS для разработки, тестирования, развертывания и эксплуатации собственных приложений на основе ИИ. Интеграция GPU и фреймворков ускоряет процессы обучения и вывода AI/ML-решений на рынок, способствуя прогрессу в приложениях искусственного интеллекта для различных секторов.

Интересно взглянуть и на то, как и для каких целей в основном использовались сервисы GaaS в 2024 году. В широком смысле это, конечно же задачи, связанные с AI/ML. Среди наиболее актуальных направлений — обучение больших языковых моделей (Large Language Models, LLM) и систем распознавания изображений. Первые активно используются бизнесом для чат-ботов и экспертных (рекомендательных) систем, работающих в режиме реального времени. Работа с изображениями широко применяется для задач машинного зрения, например распознавания лиц и объектов системами идентификации, охранного видеонаблюдения и условного доступа.

Весомую часть рынка заняли задачи, связанные с индустрией гейминга — облачные ресурсы используются не только для разработки, но и непосредственно для игр. Многие пользователи не могут позволить себе профессиональные видеокарты для ресурсоемких приложений, но вполне способны арендовать их на время в рамках облачной игровой платформы, оснащенной GPU. Такой подход сделал ресурсоемкие игры более доступными и одновременно создал, фактически, новую рыночную нишу.

В сфере развлечений и профессиональных СМИ сервисы GaaS получили широкое распространение для рендеринга видео, создания спецэффектов и другого визуального контента. Облачные GPU помогают сократить сроки выпуска медиа-продуктов и реализовать новые креативные подходы к его созданию.

Облачные ускорители все глубже проникают также в область биологии, медицины и здравоохранения. Кроме сугубо научных задач, вроде моделирования процессов сворачивания белков и геномных исследований, ИИ существенно ускоряет процесс создания и вывода на рынок новых лекарств, а также радикально повышает качество обработки и анализа медицинских изображений (снимки КТ, МРТ). Последний аспект выводит медицинскую диагностику на совершенно новый уровень эффективности.

AI-Powered Solutions for Healthcare & Life Sciences | NVIDIA

Большим спросом в 2024 году пользовались GaaS сервисы и в финансовой сфере. Банки и финтех-компании использовали мощности облачных GPU для обнаружения мошенничества в реальном времени, предотвращения хакерских атак, моделирования рисков и высокочастотной торговли.

В автомобильной отрасли облачные GPU применяли, например, для обучения ML-моделей автономных транспортных средств, обработки данных датчиков в режиме реального времени, картографирования и поиск оптимального пути на основе данных лидара. Из других актуальных направлений для применения GaaS стоит отметить Интернет вещей (IoT), «периферийные вычисления» (edge computing), научные изыскания (моделирование физических явлений, биоинформатика, эпидемиология, разработка передовых алгоритмов в криптографии и т.д.).

Accelerating the Journey to Semi-Autonomous Driving Through Innovative  Collaboration | TDK

Благодаря своей универсальности сервисы GaaS стали незаменимым решением буквально во всех отраслях экономики, требующих высокопроизводительных вычислений и технологий AI/ML. Но, похоже, тенденция еще далека от пика развития, а, значит, 2025 год принесет еще много интересного в сфере облачных GPU — как с технологической, так и с рыночной точек зрения.

Если вы планируете включится в мировую гонку ИИ-технологий или уже это сделали, то без GPU/TPU вам, скорее всего, не обойтись, а получить доступ к надежной, производительной, масштабируемой инфраструктуре GaaS можно уже сегодня в облаке De Novo. Мы предлагаем, в частности, ресурсы мощнейших TPU NVIDIA H100 и L40S непосредственно из окружения Kubernetes — в составе новых облачных уcлуг Tensor Cloud (в коллективном облаке) и HTI (сервис класса GPU Private Cloud), а с PaaS-платформой ML Cloud вы получаете еще и готовую рабочую среду для ML-инженера (класса AWS SageMaker или Google Vertex AI).

Хотите узнать больше? Обращайтесь за детальной консультацией к нашим экспертам! Они не только ответят на ваши вопросы, но и помогут развернуть пилотный проект или перенести нагрузки в облако De Novo.

© 2008—2025 De Novo (ТОВ «Де Ново»)