Меню
Головна Блог компанії De Novo Роль даних зростає в епоху ШІ
Роль даних зростає в епоху ШІ

Роль даних зростає в епоху ШІ

2024-07-29

Дані вже давно розглядаються як найважливіший бізнес актив й останніми роками їхня цінність продовжує зростати паралельно зі збільшенням загального обсягу інформації у світі. Головна причина – підвищений попит на ШІ-технології та ML-моделі, для навчання яких потрібно все більше даних. 

Обсяги цифрової інформації ростуть зі швидкістю лавини. У 2023 році фахівці говорили про те, що у світі є не менше 120 зетабайт різних даних, створених людиною. 2025 року цей показник, як очікується, сягне 180 зетабайт. Немає сенсу наводити порівняння — зрозуміло, що це просто фантастичні цифри. Звичайно, більша частина даних не має комерційної цінності (й навряд чи матиме). Проте цінної інформації теж чимало й за неї, схоже, розгортатиметься справжня боротьба, оскільки в епоху штучного інтелекту дані вже розглядаються як «валюта» для великих мовних моделей (LLM) і застосунків з підтримкою штучного інтелекту. 

Якщо у 2010 році середній розмір наборів даних, необхідних для навчання умовної «середньої» ML-моделі становив близько 6 мільйонів точок даних (data points), то 2023-го вже 750 мільярдів. При цьому, як наголошується в дослідженні BofA Software, індустрія інфраструктурного ПЗ для роботи з даними нині являє собою ринок з оборотом у $96 млрд і до 2028 року ця цифра, швидше за все, зросте до $153 млрд. Це не дивно, враховуючи, що сьогодні витрати на таке ПЗ є однією з основних статей видатків для ІТ-відділів — на це йде понад третина бюджетів. Водночас компанії все частіше використовують для роботи з даними саме хмарні програмні інструменти. На думку Gartner, до 2027 року три чверті ринку управління даними займатимуть саме хмарні платформи. 

У цілому нині на ринку простежується кілька взаємозалежних тенденцій, викликаних масовим попитом на технології штучного інтелекту. ML-моделі ростуть як на дріжджах, для них потрібно все більше вхідних даних (які у низці випадків є зовсім не безплатними). Ці дані потрібно не лише зібрати, а й належним чином підготувати. Для цього потрібні вже спеціальні програмні інструменти, попит на які (й відповідно їх ринок) зростає. Модель треба десь запустити, маючи для цього достатньо обчислювальних ресурсів і тут комерційна хмара буде найкращим рішенням по співвідношенню вартості, гнучкості та швидкості розгортання. Це, своєю чергою, веде до зростання попиту на послуги хмарних операторів по всьому світу. Й, зважаючи на вищезазначене, всі ці висхідні тенденції збережуться, як мінімум до 2027-2028 років. 

Нагадаємо, що у хмарах De Novo доступні всі необхідні ресурси та засоби для швидкого розгортання AI/ML-інфраструктур. Вже зараз ви можете отримати у своє розпорядження найпотужніші GPU/TPU акселератори NVIDIA H100, повноцінне ML-оточення для розробників або платформу для роботи з Kubernetes, засновану на найкращих світових практиках. 

© 2008—2024 De Novo (Де Ново)