Что такое LiteLLM?
2026-04-14
De Novo Cloud Expert
LiteLLM — это библиотека и прокси-шлюз для унифицированного доступа к большому количеству моделей и провайдеров через единый интерфейс в формате OpenAI. Решение можно использовать как набор средств разработки (SDK, software development kit) внутри приложения или как отдельный сервис, который стандартизирует вызовы моделей независимо от того, какой провайдер стоит за ними. Официальная документация прямо указывает на поддержку более 100 моделей и провайдеров.
В многопровайдерных архитектурах LiteLLM применяют как промежуточный слой между прикладной логикой и моделями, чтобы централизованно отслеживать расходы, задавать бюджеты для пользователей или виртуальных ключей и упрощать переключение между провайдерами. Такой подход особенно полезен там, где нужны управляемость, стандартизация и контроль операционного использования моделей.
Дополнительно LiteLLM поддерживает балансировку нагрузки между несколькими экземплярами прокси, что важно для сред Kubernetes и масштабируемых сервисов искусственного интеллекта. В документации отдельно описаны механизмы распределения RPM/TPM через Redis и возможность построения прокси-уровня, который работает как единая точка доступа к разным моделям в продуктивной инфраструктуре.