AI in the field: how Kernel solves major problems in the agricultural sector with machine learning
Fields are too large, there are too few agronomists, and the weather is too unpredictable. Could AI be the answer? Kernel is implementing 12 ML models — from growth phase forecasting to agrologistics — and showing how to transform agribusiness through data. At the case study conference “HOW IT'S DONE. AI edition,” Danilo Polyakov, Head of Data Science at Kernel, shared how the team works with machine learning to solve real-world agricultural production problems.

Kernel — один із найбільших агрохолдингів України та світовий лідер з експорту соняшникової олії — за останні п’ять років побудував системний підхід до AI: від лінійної регресії до Foundation model на інфраструктурі H100 на базі De Novo.
Навіщо це все: які проблеми агросектору вирішує AI
Агросектор — це дані, в яких багато шуму, мало повторюваності й занадто багато неконтрольованих факторів. Найбільші виклики становлять погода як ключова змінна (бо напряму впливає на строки посіву, вегетацію, фази розвитку і якість урожаю), людський фактор (дані з полів часто збираються вручну, із затримками або похибками; визначення однієї й тієї ж фази різними агрономами може суттєво відрізнятись — спостереження суб’єктивні й залежать від досвіду; деякі фази BBCH узагалі складно або неможливо зафіксувати в полі, бо вони короткотривалі або зовні невиражені), а також розподіленість полів (один агроном може обслуговувати десятки тисяч гектарів, що унеможливлює щоденний огляд).
Щоб зробити точне планування — від підготовки полів до логістики — Kernel почали автоматизувати аналіз даних за допомогою ML-моделей.
Найпоказовіший приклад — модель прогнозування фаз розвитку культур за шкалою BBCH* (від посіву насіння до фази стиглості). Від того, чи вчасно внесено добрива, чи фунгіциди, залежить частина врожайності. Але визначати фазу вручну — повільно і неточно. Тому компанія побудувала AI-модель, що автоматично прогнозує фазу росту культури на основі дати посіву, погодних умов (температура, опади), типу гібрида та геолокації.

До цього у Kernel реалізували ще низку AI-моделей: зонування полів, контроль густоти сходів, прогноз урожайності та вологості, агрологістика та поставки сировини, підрахунок зерен, оцінка Field Potential.
До початку сезону важливо розуміти, де на полі кращі умови. Kernel розробила власний ШІ-інструмент зонування, який враховує карти врожайності минулих років, супутниковий індекс NDVI, рельєф (цифрова AI-модель, 10 класів) та яскравість знімків ґрунту (як проксі для текстури ґрунту). Це дає змогу оптимізувати норму добрив і засобів захисту рослин для кожної зони.

Наступним етапом є оцінка потенціалу поля та факторів впливу за допомогою ML-моделі та аналізу SHAP values. Це дає зрозуміти, що саме впливає на врожайність на конкретному полі — наприклад, дефіцит калію. Це дозволяє агроному змінити підхід до внесення добрив ще до появи проблем.
Через 1–2 місяці після посіву проводиться зйомка дронами. Модель комп’ютерного зору рахує рослини, оцінює густоту, а також виявляє пропуски і двійники. Це допомагає коригувати налаштування техніки або реагувати на погодні ризики.

BBCH-модель допомагає агрономам завчасно підготуватися до певних фаз розвитку, коли найоптимальніше вносити гербіциди чи добрива, а ближче до кінця сезону розуміти дату настання фази стиглості.
Є також окрема CV-модель, що працює у мобільному застосунку агрономів, яким ті користуються при оглядах полів та підрахунку кількість зерен у кошику соняшника (у середньому 1000 зерен) або кукурудзи (400-500 зерен)

Модель прогнозу врожайності оновлюється щотижня, щоб враховувати актуальні дані для логістичних розрахунків і надати трейдерам орієнтири для планування цін.
Модель вологості урожаю кукурудзи — як змінюється рівень перед збором.
Модель логістики оптимізує перевезення з понад 5000 полів до десятків елеваторів, а далі — на заводи або в порти.

Компанія використовує підхід Barlow Twins (Meta AI) — витягує фічі зі супутникових та погодних масивів без ручної розмітки. Це вирішує проблему нестачі розмічених даних за наявності великих масивів погодної та супутникової інформації. Зараз це дослідницький напрям, але згодом він має допомогти ефективніше генерувати фічі для майбутніх прогнозних моделей.
Як це працює: стек, інфраструктура і моделі
Побудували повноцінну data science-інфраструктуру: обчислення — на GPU NVIDIA H100 (через De Novo); сховище — Azure, використовуються .parquet-файли або MS SQL; код — у GitLab із CI/CD; пайплайни — через Azure Data Factory і Jenkins.
Kernel має три типи запуску:
- Регулярні (щоденні/щотижневі): BBCH, урожайність, вологість.
- Сезонні: густота сходів, зонування.
- Ручні: агрологістика — з Excel-файлів спеціалістів відділу логістики (запуск підготовки графіка перевезень за вхідним згенерованим файлом).
Модель BBCH побудована на ансамблях CatBoost, ExtraTreesClassifier та LightGBM.
Додатково використовуються Optuna (для оптимізації гіперпараметрів) і Weights & Biases (трекінг експериментів).Модель навчається з урахуванням сезону — наприклад, у червні не враховує фазу, яка буває тільки в серпні.
Що довелось подолати: проблеми й оптимізація AI-моделей
Моделювання фаз BBCH зіткнулося з трьома головними проблемами:
- Нерівномірна вибірка. Агрономи частіше фіксували критичні фази, тож інші були недопредставлені.
- Хибні дані. Бувало, що фаза 31 йшла перед фазою 19 — доводилося вручну чистити дані.
- Відсутні фази. Не існує ідеального прикладу розвитку культури: на полі може бути лише один або десять оглядів за сезон, але немає даних з щоденними спостереженнями. Тому і немає можливості відстежити поступовий перехід між фазами — доступні лише поодинокі спостереження, наприклад, з фази 10 одразу до 38.
Після запуску виявили кілька типових проблем, як-от «повернення» назад (фаза могла «відкотитися» на одну назад), «стрибки» фаз (іноді фаза могла різко перейти з 16 до 21) та плато (модель «застрягала» на певному етапі).
Рішенням стало залучення агрономів для ручного уточнення, запровадження згладжування кривих росту, а також побудова алгоритму, що перевіряє логіку фаз — наприклад, жодна не може «перестрибнути» іншу.
AI-модель тримає accuracy ~0.75, що підтверджено польовими перевірками. 95% передбачень не помиляються більше ніж на одну фазу.
Завдяки SHAP-аналізу вдалось зрозуміти, що на початку сезону впливають день року, температура, опади; у середині — тип гібрида, світловий день, а в кінці — координати поля й температура.
Що далі? У Kernel працюють над переходом до довгострокового прогнозу фази BBCH — тобто кривої росту, яку можна передбачити наперед на тижні, й завчасно планувати обробки.
*BBCH (Biologische Bundesanstalt, Bundessortenamt und CHemische Industrie) — це міжнародна шкала фенологічного розвитку рослин, що описує фази росту культур від проростання до повного дозрівання. В агробізнесі ця шкала критично важлива, адже допомагає агрономам ухвалювати рішення щодо внесення добрив, обробки фунгіцидами та інших агротехнічних заходів у правильний час.
Cases
The e-Permit service has received an AI module that automatically checks documents, relieving officials of routine tasks
This unique model could change cardiac diagnostics worldwide. Powered by biosensors and NVIDIA H100 capabilities, the system performs diagnostics in minutes instead of hours
This is a story about how artificial intelligence helps the ministry review applications for youth exchanges: it analyzes estimates, filters out vague goals, identifies unjustified expenses, and suggests areas that need clarification
We went to an AI conference for you, and now we're telling you a story about how buying a cheap camera almost ruined a project to implement computer vision at a company. And that's not the only thing that went wrong
Fields are too large, there are too few agronomists, and the weather is too unpredictable. Could AI be the answer? Kernel is implementing 12 ML models — from growth phase forecasting to agrologistics — and showing how to transform agribusiness through data
The Ministry of Youth and Sports of Ukraine has launched the country's first service based on large language models (LLM) on the Dія.Engine platform. The most powerful equipment in Ukraine was used to host the LLM
Every company goes through its own “digital transformation” journey, and each case is unique. This is especially true when it comes to national-scale organizations
The success of an agricultural company today largely depends on information technology. Increasing yields, optimizing logistics, achieving deep automation of routine operations, and ensuring full mobility of employees—all this is possible thanks to the effective use of IT
We discussed how “digital transformation” works in specific examples in the country with Yevhen Yentis, a person without whose participation it is difficult to imagine the success of such national-scale projects as Prozorro and “New Customs”
Interview with Andriy Begunov, Director of the Information Technology Department at PUMB Bank, which ranks among Ukraine's top seven banks in terms of assets (according to data from the National Bank of Ukraine)