Меню
Главная Блог компании De Novo Роль данных растет в эпоху ИИ
Роль данных растет в эпоху ИИ

Роль данных растет в эпоху ИИ

2024-07-29

Данные уже давно рассматриваются как важнейший бизнес-актив и в последние годы их ценность продолжает расти параллельно с увеличением общего объема информации в мире. Главная причина — повышенный спрос на ИИ-технологии и ML-модели, для обучения которых требуется все больше данных. 

Нарастающая лавина цифровой информации и не думает останавливаться. К примеру, в 2023 году специалисты говорили о том в мире имеется не менее 120 зеттабайт различных данных, созданных человеком. В 2025 году этот показатель, как ожидается, достигнет 180 зеттабайт. Нет смысла приводить сравнения — и без того очевидно, что это просто фантастические цифры. Конечно, большая часть данных не имеет коммерческой ценности (и вряд ли будет ее иметь). Ценной информации тоже немало и за нее, похоже, будет разворачиваться настоящая борьба, поскольку в эпоху искусственного интеллекта данные уже рассматриваются как некая «валюта» для больших языковых моделей (LLM) и приложений с поддержкой искусственного интеллекта.  

Если в 2010 году средний размер наборов данных, необходимых для обучения условной «средней» ML-модели составлял около 6 миллионов точек данных (data points), то в 2023-м уже 750 миллиардов. При этом, как отмечается в исследовании BofA Software, индустрия инфраструктурного ПО для работы с данными в настоящее время представляет собой рынок с оборотом в $96 млрд и к 2028 году эта цифра, скорее всего, вырастет до $153 млрд. Это неудивительно, учитывая, что сегодня расходы на такое ПО являются одной из основных статей затрат для ИТ-отделов — на это уходит свыше трети бюджетов. В то же время, компании все чаще используют облачные программные инструменты для работы с данными. По мнению Gartner, к 2027 году три четверти рынка управления данными будут занимать именно облачные платформы. 

В целом, сейчас на рынке прослеживается несколько взаимосвязанных тенденций, вызванных массовым интересном к технологиям искусственного интеллекта. ML-модели растут как на дрожжах, для них требуется все больше исходных данных (которые в ряде случаев вовсе не бесплатны). Эти данные нужно не только собрать, но и должным образом подготовить. Для этого требуется уже специальные программные инструменты, спрос на которые (и соответственно рынок) растет. Модель надо где-то запустить, имея для этого достаточно вычислительных ресурсов и здесь коммерческое облако будет лучшим решением по соотношению стоимости, гибкости и скорости развертывания. Это, в свою очередь, ведет росту спроса на услуги облачных операторов по всему миру. И, судя по всему, все эти восходящие тенденции сохранятся, как минимум до 2027 - 2028 годов. 

Напомним, что в облаках De Novo доступны все необходимые мощности и средства для быстрого разворачивания AI/ML-инфраструктур. Уже сейчас вы можно получить в свое распоряжение мощнейшие GPU/TPU акселераторы NVIDIA H100, полноценное ML-окружение для разработчиков или платформу для работы с Kubernetes, основанную на лучших мировых практиках. 

© 2008—2024 De Novo (Де Ново)