AI на поле: как Kernel решает главные проблемы агросектора с помощью Machine Learning
Слишком большие поля, слишком мало агрономов, слишком переменчивая погода. Может ли искусственный интеллект быть ответом? Kernel внедряет 12 ML-моделей — от прогноза фаз роста до агрологистики — и показывает, как трансформировать агробизнес с помощью данных. На конференции кейсов «КАК ЭТО СДЕЛАНО. AI edition» Даниил Поляков, Head of Data Science в Kernel, поделился, как команда работает с машинным обучением для решения реальных задач агропроизводства.

Kernel — один из крупнейших агрохолдингов Украины и мировой лидер по экспорту подсолнечного масла — за последние пять лет построил системный подход к AI: от линейной регрессии до Foundation model на инфраструктуре H100 на базе De Novo.
Зачем это все: какие проблемы агросектора решает AI
Агросектор — это данные, в которых много шума, мало повторяемости и слишком много неконтролируемых факторов. Наибольшие вызовы представляют погода как ключевая переменная (поскольку напрямую влияет на сроки посева, вегетацию, фазы развития и качество урожая), человеческий фактор (данные с полей часто собираются вручную, с задержками или погрешностями; определение одной и той же фазы разными агрономами может существенно отличаться — наблюдения субъективны и зависят от опыта; некоторые фазы BBCH вообще сложно или невозможно зафиксировать в поле, потому что они кратковременны или внешне не выражены), а также распределенность полей (один агроном может обслуживать десятки тысяч гектаров, что делает невозможным ежедневный осмотр).
Чтобы сделать точное планирование — от подготовки полей до логистики — Kernel начали автоматизировать анализ данных с помощью ML-моделей.
Самый показательный пример — модель прогнозирования фаз развития культур по шкале BBCH* (от посева семян до фазы спелости). От того, вовремя ли внесены удобрения или фунгициды, зависит часть урожайности. Но определять фазу вручную — медленно и неточно. Поэтому компания построила AI-модель, которая автоматически прогнозирует фазу роста культуры на основе даты посева, погодных условий (температура, осадки), типа гибрида и геолокации.

До этого в Kernel реализовали еще ряд AI-моделей: зонирование полей, контроль плотности всходов, прогноз урожайности и влажности, агрологистика и поставки сырья, подсчет зерен, оценка Field Potential.
До начала сезона важно понимать, где на поле лучшие условия. Kernel разработала собственный ШИ-инструмент зонирования, который учитывает карты урожайности прошлых лет, спутниковый индекс NDVI, рельеф (цифровая AI-модель, 10 классов) и яркость снимков почвы (как прокси для текстуры почвы). Это позволяет оптимизировать норму удобрений и средств защиты растений для каждой зоны.

Следующим этапом является оценка потенциала поля и факторов влияния с помощью ML-модели и анализа SHAP values. Это позволяет понять, что именно влияет на урожайность на конкретном поле — например, дефицит калия. Это позволяет агроному изменить подход к внесению удобрений еще до появления проблем.
Через 1–2 месяца после посева проводится съемка дронами. Модель компьютерного зрения считает растения, оценивает густоту, а также выявляет пропуски и двойники. Это помогает корректировать настройки техники или реагировать на погодные риски.

BBCH-модель помогает агрономам заблаговременно подготовиться к определенным фазам развития, когда наиболее оптимально вносить гербициды или удобрения, а ближе к концу сезона понимать дату наступления фазы спелости.
Есть также отдельная CV-модель, работающая в мобильном приложении агрономов, которое они используют при осмотре полей и подсчете количества зерен в корзине подсолнечника (в среднем 1000 зерен) или кукурузы (400-500 зерен).

Модель прогноза урожайности обновляется еженедельно, чтобы учитывать актуальные данные для логистических расчетов и предоставить трейдерам ориентиры для планирования цен.
Модель влажности урожая кукурузы — как меняется уровень перед сбором.
Модель логистики оптимизирует перевозки с более чем 5000 полей к десяткам элеваторов, а далее — на заводы или в порты.

Компания использует подход Barlow Twins (Meta AI) — извлекает фичи из спутниковых и погодных массивов без ручной разметки. Это решает проблему нехватки размеченных данных при наличии больших массивов погодной и спутниковой информации. Сейчас это исследовательское направление, но впоследствии оно должно помочь более эффективно генерировать фичи для будущих прогнозных моделей.
Как это работает: стек, инфраструктура и модели
Построили полноценную data science-инфраструктуру: вычисления — на GPU NVIDIA H100 (через De Novo); хранилище — Azure, используются .parquet-файлы или MS SQL; код — в GitLab с CI/CD; пайплайны — через Azure Data Factory и Jenkins.
Kernel имеет три типа запуска:
- Регулярные (ежедневные/еженедельные): BBCH, урожайность, влажность.
- Сезонные: густота всходов, зонирование.
- Ручные: агрологистика — из Excel-файлов специалистов отдела логистики (запуск подготовки графика перевозок по входящему сгенерированному файлу).
Модель BBCH построена на ансамблях CatBoost, ExtraTreesClassifier и LightGBM.
Дополнительно используются Optuna (для оптимизации гиперпараметров) и Weights & Biases (трекинг экспериментов). Модель обучается с учетом сезона — например, в июне не учитывает фазу, которая бывает только в августе.
Что пришлось преодолеть: проблемы и оптимизация AI-моделей
Моделирование фаз BBCH столкнулось с тремя основными проблемами:
- Неравномерная выборка. Агрономы чаще фиксировали критические фазы, поэтому другие были недопредставлены.
- Неверные данные. Бывало, что фаза 31 шла перед фазой 19 — приходилось вручную чистить данные.
- Отсутствующие фазы. Не существует идеального примера развития культуры: на поле может быть только один или десять осмотров за сезон, но нет данных с ежедневными наблюдениями. Поэтому и нет возможности отследить постепенный переход между фазами — доступны только единичные наблюдения, например, с фазы 10 сразу до 38.
После запуска обнаружили несколько типичных проблем, таких как «возврат» назад (фаза могла «откатиться» на одну назад), «скачки» фаз (иногда фаза могла резко перейти с 16 на 21) и плато (модель «застревала» на определенном этапе).
Решением стало привлечение агрономов для ручного уточнения, внедрение сглаживания кривых роста, а также построение алгоритма, проверяющего логику фаз — например, ни одна не может «перепрыгнуть» другую.
AI-модель держит accuracy ~0.75, что подтверждено полевыми проверками. 95% предсказаний не ошибаются более чем на одну фазу.
Благодаря SHAP-анализу удалось понять, что в начале сезона влияют день года, температура, осадки; в середине — тип гибрида, световой день, а в конце — координаты поля и температура.
Что дальше? В Kernel работают над переходом к долгосрочному прогнозу фазы BBCH — то есть кривой роста, которую можно предсказать заранее на неделю и заблаговременно планировать обработки.
* BBCH (Biologische Bundesanstalt, Bundessortenamt und CHemische Industrie) — это международная шкала фенологического развития растений, описывающая фазы роста культур от прорастания до полного созревания. В агробизнесе эта шкала критически важна, ведь помогает агрономам принимать решения о внесении удобрений, обработке фунгицидами и других агротехнических мероприятиях в нужное время.
Кейсы
Сервис «єДозвіл» получил ИИ-модуль, который автоматически проверяет документы, снимая рутину с чиновников
Уникальная модель может изменить мировую кардиодиагностику. Работая на биосенсорах и мощностях NVIDIA H100, система проводит диагностику за минуты вместо часов
Это история о том, как искусственный интеллект помогает министерству проверять заявки на молодежные обмены: анализирует сметы, фильтрует размытые цели, выявляет необоснованные расходы и подсказывает, где стоит уточнить
Посетили за вас конференцию по AI, и сейчас рассказываем историю о том, как покупка дешевой камеры едва не сорвала проект по внедрению computer vision на предприятии. И это не единственное, что пошло не так
Слишком большие поля, слишком мало агрономов, слишком переменчивая погода. Может ли искусственный интеллект быть ответом? Kernel внедряет 12 ML-моделей — от прогноза фаз роста до агрологистики — и показывает, как трансформировать агробизнес с помощью данных
Министерство молодежи и спорта Украины запустило первый в стране сервис на базе больших языковых моделей (LLM) на платформе Дія.Engine. Для размещения LLM использовали самое мощное в Украине оборудование
Каждая компания проходит свой путь «цифровой трансформации» и в каждом случае он уникальный. Особенно, если речь идет об организации национального масштаба
Успех агропромышленной компании сегодня во многом зависит от информационных технологий. Повысить урожайность, оптимизировать логистику, добиться глубокой автоматизации рутинных операций и обеспечить полную мобильность сотрудников — все это возможно благодаря эффективному применению ИТ
О том, как, работает «цифровая трансформация» на конкретных примерах в государстве мы поговорили с Евгением Ентисом — человеком, без участия которого трудно представить успех таких проектов национального масштаба как Prozorro и «Нова митниця»
Интервью с Андреем Бегуновым, директором департамента информационных технологий банка ПУМБ, который входит в ТОП-7 банков Украины по объемам активов (данные НБУ)