раздел 10 · подстраница 3
Оптимизация стоимости
Если вы платите по API-ключу (а не плоской подпиской Pro/Max), каждый токен на счёте. Есть четыре рычага, которые могут сократить расходы в 5-10 раз: компакт контекста, кэш промптов, выбор модели и грамотные сессии.
/compact vs /clear
Контекст Claude растёт с каждым сообщением. Каждый следующий ответ оплачивается с учётом всей истории. Когда контекст под 200k - вы платите по полной за каждый token.
/compact
Claude сам сжимает текущую историю в короткое резюме. История уменьшается, но "память" о теме сохраняется.
> /compact
Используйте когда:
- Долгая сессия, контекст под 60-70%
- Тема не меняется, продолжаете ту же задачу
- Хотите освободить место под новые файлы
/clear
Полная очистка. История стирается, CLAUDE.md и подключённые MCP остаются.
> /clear
Используйте когда:
- Закончили одну задачу, переходите к совершенно другой
- Хотите начать с нуля
- Старый контекст путает Claude (он помнит уже снятые требования)
Правило: /compact - чаще, /clear - между разными задачами.
Prompt caching - экономия до 90%
Anthropic API поддерживает кэш промптов. Если вы посылаете одно и то же начало сообщения (например, большой CLAUDE.md или системный промпт) много раз - Anthropic кэширует его на сервере и считает читой "из кэша" в 10 раз дешевле.
Claude Code использует это автоматически. Кэшируются:
- CLAUDE.md (глобальный и проектный)
- Системный промпт Claude Code
- Большие файлы, которые вы упоминали в начале сессии
Видимая экономия:
- Без кэша - 1М токенов context для Opus 4.7 стоит около $15
- С кэшем (попадание) - около $1.50 за тот же 1М
В Claude Code вы не управляете кэшем напрямую - он включён всегда. Но можете способствовать попаданиям:
- Не меняйте CLAUDE.md в середине сессии
- Не обновляйте часто-читаемые файлы маленькими правками - кэш сбрасывается
Переключение модели под задачу
Не каждая задача требует Opus. Сменить модель: /model.
Когда какую брать
Haiku 4.5 - простые задачи, формальные правки
- Переименовать переменную в 10 файлах
- Сформатировать JSON
- Сгенерировать boilerplate (CRUD)
- Простые git-команды
- Извлечение данных по шаблону
Sonnet 4.6 - повседневный рабочий конь
- Большинство фич
- Чтение и понимание кода
- Написание тестов
- Дебаг типичных багов
- Ревью
Opus 4.7 - тяжёлая интеллектуальная работа
- Архитектурные решения
- Сложные миграции
- Нетривиальные баги, требующие гипотез
- Глубокий ресёрч
Стратегия
Начинайте день на Sonnet. Переключайтесь на Haiku для рутины (/model haiku) и на Opus для критичных моментов. Не сидите на Opus постоянно "потому что лучшая" - переплатите без пользы.
Таблица стоимости 1М токенов
Цифры примерные (API Anthropic, на момент написания). На сайте Anthropic актуальные.
| Модель | Input (без кэша) | Input (cache hit) | Output | | --- | --- | --- | --- | | Haiku 4.5 | $1 | $0.10 | $5 | | Sonnet 4.6 | $3 | $0.30 | $15 | | Opus 4.7 | $15 | $1.50 | $75 |
Output всегда в 5 раз дороже input - это общее правило. Большие "развёрнутые" ответы стоят больше, чем кажется.
Подписки vs API
- Pro ($20/мес) - покрывает большинство личных проектов, но есть лимит по сообщениям. Sonnet 4.6 как основная.
- Max ($100-200/мес) - вырванный из лимитов план, Opus доступен щедро. Окупается, если работаете полный рабочий день.
- API-ключ - оплата по факту. Гибко, но при большом потреблении дороже Max.
Если у вас работа фуллтайм в Claude Code - подписка дешевле API в разы.
Антипаттерны
- Сидеть на Opus 4.7 для копипасты JSON. Платите x15 за разницу, которую не используете.
- Никогда не делать
/compact- сессия раздувается, каждый запрос платит за всю историю. - Делать
/clearслишком часто. Сбрасываете контекст, в котором уже разобрались - и Claude нужно перечитывать заново. - Огромный CLAUDE.md, который меняется каждый день - кэш не работает, платите за чтение каждый раз.
Полезные ссылки
- Pricing - актуальные цены
- Prompt caching docs - как работает кэш
- /cost - команда статистики в Claude Code