De Novo та MK-consulting розповіли про етапи розвитку та рівні зрілості ML-проектів
2024-09-18
12 вересня 2024 року компанії De Novo та MK-consulting провели спільний вебінар «ML-проєкти: етапи розвитку та рівні зрілості» на якому поділились практичним досвідом та цінними напрацюваннями у галузі розробки та впровадження ML-рішень.
Світовий інтерес щодо штучного інтелекту та машинного навчання не вщухає. Проте, структура запитів стрімко змінюється. Після першого потужного враження, коли AI/ML намагалися впровадити буквально всюди (не дивлячись — потрібно це чи ні), замовники та розробники почали більш зважено підходити як до технології в цілому, так і до її складових. Нові проекти все частіше створюють більш зважено та помірковано. В цих обставинах дуже важливо розуміти, як розвивається ефективний проєкт на практиці — які етапи він повинен проходити та які риси говорять про його зрілість. Досвідом у цих питаннях поділився Євген Краснокутський, ML Lead MK-consulting, окрім того, Геннадій Карпов, директор з технологій De Novo розповів про дорожню карту та плани розвитку першої національної AI/ML-платформи ML Cloud.
Основний акцент під час вебінару було зроблено на практичні поради та демонстрації, тому все ж таки, пропонуємо переглянути повне відео заходу — буде цікаво.
Від ідеї до впровадження
Багато уваги було приділено розгляду основних етапів ML-проєктів. На першому кроці найголовніше — визначити справжні потреби бізнесу. Це досить важлива й складна задача, бо далеко не завжди потенційний замовник може вірно зіставити власні потреби та можливості (фінансові, технічні тощо). Проте, коли визначилися з ідеєю, наступним кроком її потрібно валідувати — перевірити, чи є достатньо даних для тренування ML-моделі та чи можливо вирішити поставлену задачу за допомогою машинного навчання (ML feasibility).
Якщо задача реальна за наявних умов, далі йде розробка MVP — створення мінімально життєздатного продукту для демонстрації концепції та збору відгуку користувачів. За умови, що MVP в цілому всіх влаштовує, варто перейти до вибору технологій для впровадження й підтримки повноцінного проєкту. На цьому етапі робиться визначення оптимального стеку технологій, включаючи фреймворки, бібліотеки та інструменти для розробки.
Варто ретельно підходити й до питань масштабування проєкту. Зокрема, треба забезпечити відстеження змін у даних, а також створити тестове середовище яке дозволяє проводити численні експерименти та порівнювати результати різних ML-моделей, кращі з яких можна впроваджувати. Важливо також обрати надійну, потужну та функціональну платформу для розгортання моделі та забезпечення її доступності для користувачів. На етапі експлуатації потрібен постійний моніторинг продуктивності моделей та якості даних для своєчасного виявлення та усунення потенційних проблем. В подальшому оцінку зрілості проєкту можна здійснювати за різними метриками та критеріями, зокрема такими як якість даних, стабільність роботи, ефективність тощо.
Ключові висновки:
- Успішний ML-проект вимагає комплексного підходу: від збору та підготовки даних до повноцінного розгортання моделей.
- Якість даних визначає якість моделей: необхідно приділяти достатньо уваги очищенню та підготовці даних.
- Зрілість проекту треба оцінювати за допомогою метрик: це дозволяє відстежувати прогрес та виявляти області для вдосконалення.
- Інфраструктура відіграє ключову роль: надійні інструменти для версіонування, експериментування та моніторингу є необхідними.
- В будь-якому випадку для успішного створення ML-проєкту потрібна злагоджена командна робота між інженерами з даних, ML-інженерами та DevOps-спеціалістами.
ML Cloud — для розробки та розгортання моделей машинного навчання
Друга частина вебінара була присвячена питанням комплексної апаратно-програмної інфраструктури для тестування, розгортання та експлуатації ML-проєктів. Зокрема, Геннадій Карпов присвятив свій доклад тому, як українська платформа ML Cloud може допомогти користувачам на кожному з рівнів зрілості ML-проєкту. Також у доповіді було окреслено подальші плани розвитку платформи ML Cloud та зазначено, які інструменти будуть доступні українським DevOps та ML-розробникам вже незабаром.
Платформа De Novo ML Cloud пропонує комплексне середовище для розробки та розгортання моделей машинного навчання. Вона надає широкий спектр інструментів та сервісів, які спрощують процес створення та використання моделей штучного інтелекту. Платформа поєднує інтегровану, попередньо сконфігуровану й самодостатню збірку «best of breed» відкритого ПЗ для задач ML/AI та найпотужніші в світі акселератори NVIDIA H100/L40S. Рішення користується попитом серед замовників, запити яких втім зростають. Тому, De Novo продовжує розвиток ML Cloud, доповнюючи платформу новими інструментами. Зокрема з’явиться мультитенантний варіант S3-сумісного об'єктного сховища на базі Міniо. Також у найближчих планах впровадження нового типу сервісу — Database as a Service (СУБД з хмари за запитом), та системи типу Identity Access Management (IAM) для управління обліковими записами. Також найближчим часом у складі ML Cloud з’являться нові оркестратори, що допоможуть ще більш ефективно керувати жизненим циклом ML-сервісів. Для більшої зручності користувачів планується додатково запровадити систему оплати за принципом pay-as-you-go (оплата лише тих потужностей, що були фактично спожиті — не більше не менше).
Що стосується аппаратної складової, то тут ML Cloud скоро зможе запропонувати опцію Multi-GPU Traning, що дозволяє об’єднати за допомогою фірмового надшвидкого інтерконекту потужності двох прискорювачів NVIDIA H100 у єдину систему із загальним обсягом оперативної пам’яті у 160 ГБ (80+80). На додачу будуть покращені та розширені можливості багатокористувацького споживання ресурсів GPU-прискорювачів.
За підсумком, гості вебінару отримали практичні знання та інсайти для успішної розробки ML-проектів, дізналися про можливості української платформи ML Cloud, змогли поспілкуватися з експертам, що мають величезний практичний досвід, та отримати відповіді на актуальні питання щодо впровадження технологій машинного навчання.
На завершення, знову запрошуємо вас до перегляду повного відео вебінару. Якщо ж у вас з’явився інтерес до ML-сервісів, то задавайте питання нашим експертам через форму зворотного зв’язку.