раздел 05
Шпаргалка
Весь курс на одной странице: чек-лист контроля расходов, числа-ориентиры и куда смотреть.
Чек-лист контроля расходов
- Соберите список всех AI-сервисов. Подписки, API, агрегаторы, хостинг, доп. сервисы. Без списка не видно картины.
- Разделите фиксированное и плавающее. Подписки прогнозируемы, API по счётчику требует лимитов.
- Прикиньте бюджет API заранее. Размер запроса × цена модели × число запросов + запас.
- Поставьте алерты и hard limit. Алерт на 50% и 80%, hard limit на 100-150% бюджета (ориентир).
- Для экспериментов берите prepaid. Нельзя потратить больше внесённого.
- Раз в неделю смотрите дашборд расхода. Аномалия не доживёт до счёта.
- Раз в квартал чистите подписки. Отключайте то, чем не пользуетесь.
Числа-ориентиры
| Что | Ориентир | | --- | --- | | Цена API | за 1M токенов, выход дороже входа | | Дешёвая / флагманская модель | разница в десятки-сотни раз | | Запас к прикидке бюджета | +20-50% | | Алерты | на 50% и 80% бюджета | | Hard limit | на 100-150% бюджета |
Все числа - ориентиры для интуиции. Точные тарифы и лимиты смотрите в кабинете провайдера.
Рычаги экономии по силе
- Модель под задачу - режет счёт в разы. Самый сильный.
- Короткий контекст - платите за весь контекст каждый запрос.
- Кэш - скидка на повторяемый префикс.
- Батчинг - дешевле, если ответ не нужен мгновенно.
- Опенсорс - окупается на большом стабильном объёме.
- Агрегаторы - один счёт, маршрутизация, фолбэки.
Связанные курсы
- Токены - как считается стоимость запроса.
- Выбор модели под задачу - главный рычаг экономии.
- Свои опенсорс-модели - когда выгоднее API.
- OpenRouter - агрегатор с одним счётом и фолбэками.