Що таке LiteLLM?
2026-04-14
De Novo Cloud Expert
LiteLLM — це бібліотека та проксі-шлюз для уніфікованого доступу до великої кількості моделей і провайдерів через єдиний інтерфейс у форматі OpenAI. Рішення можна використовувати як набір засобів розробки (SDK, software development kit) усередині застосунку або як окремий сервіс, який стандартизує виклики моделей, незалежно від того, який провайдер стоїть за ними. Офіційна документація прямо вказує на підтримку понад 100 моделей і провайдерів.
У багатопровайдерних архітектурах LiteLLM застосовують як проміжний шар між прикладною логікою та моделями, щоб централізовано відстежувати витрати, задавати бюджети для користувачів або віртуальних ключів і спрощувати перемикання між провайдерами. Такий підхід особливо корисний там, де потрібні керованість, стандартизація й контроль операційного використання моделей.
Додатково LiteLLM підтримує балансування навантаження між кількома інстансами проксі, що важливо для середовищ Kubernetes і масштабованих сервісів штучного інтелекту. У документації окремо описані механізми розподілу RPM/TPM через Redis та можливість побудови проксі-рівня, який працює як єдина точка доступу до різних моделей у продуктивній інфраструктурі.