Gemma 4 – что это?

2026-05-04

De Novo Cloud Expert

Gemma 4 от Google — семейство открытых ИИ-моделей, ориентированных на рассуждения, разработку ПО, мультимодальные сценарии и агентные рабочие процессы. Является прямым продолжением серии открытых моделей Gemma (а именно Gemma 3) и распространяется под лицензией Apache 2.0. Последний фактор важен для компаний, которым нужна ИИ-модель с открытыми весами и возможностью развертывания в собственной инфраструктуре. В отличие от закрытых Gemini-моделей, эта линейка рассчитана на широкий круг пользователей. Например, её можно интегрировать в CI/CD-пайплайны для автоматического код-ревью или использовать как ядро для локальных AI-агентов разработки.

Модель Gemma 4 достаточно компактна, но при этом имеет большое контекстное окно. Малые модели поддерживают окно до 128 тыс. токенов, средние — до 256 тыс. токенов. Это особенно важно в сценариях, где модель должна сохранять контекст между несколькими этапами работы. На практике это оптимально для поиска первопричин сбоев (Root Cause Analysis) в объемных логах кластеров или масштабного рефакторинга монолитных приложений.

Отдельный акцент сделан на мультимодальности. Все модели семейства работают с текстом и изображениями. При этом Gemma 4 является довольно ресурсоёмкой: для стабильной работы ей нужны мощные GPU/TPU и подходящая программная среда, поэтому для оптимизации развертывания подобных моделей часто применяют фреймворки вроде vLLM или TGI, позволяющие более эффективно использовать память GPU-ускорителей.