раздел 02
Шлюзы: всё через один слой
Шлюз (gateway, прокси) - это сервис-посредник, через который идут все ваши запросы к разным LLM. Вы меняете в коде только адрес: вместо api.openai.com указываете адрес шлюза, дальше он сам ходит к нужному провайдеру. А поскольку через него проходит каждый запрос - он видит и считает всё.
Что даёт шлюз
LiteLLM - де-факто стандарт
LiteLLM (репозиторий BerriAI/litellm на GitHub) - самый популярный открытый шлюз. Поддерживает 100+ провайдеров (OpenAI, Anthropic, Groq, Vertex AI, Bedrock, Azure и др.) через единый OpenAI-совместимый формат. В режиме прокси даёт ровно то, что нужно для контроля: cost tracking, бюджеты, rate limiting, виртуальные ключи, логирование. Можно поднять у себя (self-hosted) или взять облачную версию.
Другие шлюзы
Про OpenRouter как готовый облачный вариант - отдельный курс OpenRouter. Про то, как вообще устроен вызов LLM по API - Нейронки по API напрямую.
Минус шлюза
Через шлюз проходит весь трафик - это единая точка отказа и ещё один сервис, который надо держать (если self-hosted). Поэтому для одного-двух сервисов он избыточен: проще лимиты руками или лёгкий мониторинг (раздел 03).