раздел 00

Проблема: расходы размазаны

Как только вы начинаете работать с AI всерьёз, у вас появляется не один счёт, а целый зоопарк: OpenAI по токенам, Anthropic по токенам, Groq, fal.ai за картинки, OpenRouter, плюс подписки на инструменты вроде Cursor и Claude Code. Деньги уходят в десяти местах, и общей картины нет нигде.

«Найди сервис, который контролирует мои расходы и балансы по всем моим API-сервисам и инструментам» - очень частый и здравый запрос. Разберём, что для этого есть.

Чем это грозит

Сюрприз в счёте
Забытый цикл, утёкший ключ или тяжёлый запрос - и в конце месяца неприятная сумма.
Нет общей картины
У каждого провайдера свой кабинет. Сложить всё вместе вручную почти нереально.
Непонятно, где течёт
Какой сервис, проект или ключ съедает больше всего - без учёта не видно.

Что вообще можно сделать

Есть четыре разных по усилиям подхода, и часто их комбинируют:

  • Руками - включить лимиты и алерты в кабинете каждого провайдера. Бесплатно, но разрозненно.
  • Мониторинг - поставить сервис, который читает ваши ключи или логи и показывает расходы в одном дашборде с алертами. Код менять не нужно.
  • Шлюз (gateway) - пропускать все запросы через один слой, который считает деньги, ставит бюджеты и лимиты и выдаёт «виртуальные ключи». Максимум контроля.
  • Снижение расходов - кэш, маршрутизация на дешёвые модели, компрессия контекста. Не следить, а платить меньше.

Как читать гайд

  • 01 - четыре подхода подробно, чем отличаются.
  • 02 - шлюзы (LiteLLM и аналоги): всё через один слой.
  • 03 - мониторинг без смены кода.
  • 04 - как реально снизить расходы.
  • 05 - что выбрать под ваш случай, чек-лист и словарь.