раздел 00
Проблема: расходы размазаны
Как только вы начинаете работать с AI всерьёз, у вас появляется не один счёт, а целый зоопарк: OpenAI по токенам, Anthropic по токенам, Groq, fal.ai за картинки, OpenRouter, плюс подписки на инструменты вроде Cursor и Claude Code. Деньги уходят в десяти местах, и общей картины нет нигде.
«Найди сервис, который контролирует мои расходы и балансы по всем моим API-сервисам и инструментам» - очень частый и здравый запрос. Разберём, что для этого есть.
Чем это грозит
Сюрприз в счёте
Забытый цикл, утёкший ключ или тяжёлый запрос - и в конце месяца неприятная сумма.
Нет общей картины
У каждого провайдера свой кабинет. Сложить всё вместе вручную почти нереально.
Непонятно, где течёт
Какой сервис, проект или ключ съедает больше всего - без учёта не видно.
Что вообще можно сделать
Есть четыре разных по усилиям подхода, и часто их комбинируют:
- Руками - включить лимиты и алерты в кабинете каждого провайдера. Бесплатно, но разрозненно.
- Мониторинг - поставить сервис, который читает ваши ключи или логи и показывает расходы в одном дашборде с алертами. Код менять не нужно.
- Шлюз (gateway) - пропускать все запросы через один слой, который считает деньги, ставит бюджеты и лимиты и выдаёт «виртуальные ключи». Максимум контроля.
- Снижение расходов - кэш, маршрутизация на дешёвые модели, компрессия контекста. Не следить, а платить меньше.
Как читать гайд
- 01 - четыре подхода подробно, чем отличаются.
- 02 - шлюзы (LiteLLM и аналоги): всё через один слой.
- 03 - мониторинг без смены кода.
- 04 - как реально снизить расходы.
- 05 - что выбрать под ваш случай, чек-лист и словарь.