раздел 10 · подстраница 3

Оптимизация стоимости

Если вы платите по API-ключу (а не плоской подпиской Pro/Max), каждый токен на счёте. Есть четыре рычага, которые могут сократить расходы в 5-10 раз: компакт контекста, кэш промптов, выбор модели и грамотные сессии.

/compact vs /clear

Контекст Claude растёт с каждым сообщением. Каждый следующий ответ оплачивается с учётом всей истории. Когда контекст под 200k - вы платите по полной за каждый token.

/compact

Claude сам сжимает текущую историю в короткое резюме. История уменьшается, но "память" о теме сохраняется.

> /compact

Используйте когда:

  • Долгая сессия, контекст под 60-70%
  • Тема не меняется, продолжаете ту же задачу
  • Хотите освободить место под новые файлы

/clear

Полная очистка. История стирается, CLAUDE.md и подключённые MCP остаются.

> /clear

Используйте когда:

  • Закончили одну задачу, переходите к совершенно другой
  • Хотите начать с нуля
  • Старый контекст путает Claude (он помнит уже снятые требования)

Правило: /compact - чаще, /clear - между разными задачами.

Prompt caching - экономия до 90%

Anthropic API поддерживает кэш промптов. Если вы посылаете одно и то же начало сообщения (например, большой CLAUDE.md или системный промпт) много раз - Anthropic кэширует его на сервере и считает читой "из кэша" в 10 раз дешевле.

Claude Code использует это автоматически. Кэшируются:

  • CLAUDE.md (глобальный и проектный)
  • Системный промпт Claude Code
  • Большие файлы, которые вы упоминали в начале сессии

Видимая экономия:

  • Без кэша - 1М токенов context для Opus 4.7 стоит около $15
  • С кэшем (попадание) - около $1.50 за тот же 1М

В Claude Code вы не управляете кэшем напрямую - он включён всегда. Но можете способствовать попаданиям:

  • Не меняйте CLAUDE.md в середине сессии
  • Не обновляйте часто-читаемые файлы маленькими правками - кэш сбрасывается

Переключение модели под задачу

Не каждая задача требует Opus. Сменить модель: /model.

Когда какую брать

Haiku 4.5 - простые задачи, формальные правки

  • Переименовать переменную в 10 файлах
  • Сформатировать JSON
  • Сгенерировать boilerplate (CRUD)
  • Простые git-команды
  • Извлечение данных по шаблону

Sonnet 4.6 - повседневный рабочий конь

  • Большинство фич
  • Чтение и понимание кода
  • Написание тестов
  • Дебаг типичных багов
  • Ревью

Opus 4.7 - тяжёлая интеллектуальная работа

  • Архитектурные решения
  • Сложные миграции
  • Нетривиальные баги, требующие гипотез
  • Глубокий ресёрч

Стратегия

Начинайте день на Sonnet. Переключайтесь на Haiku для рутины (/model haiku) и на Opus для критичных моментов. Не сидите на Opus постоянно "потому что лучшая" - переплатите без пользы.

Таблица стоимости 1М токенов

Цифры примерные (API Anthropic, на момент написания). На сайте Anthropic актуальные.

| Модель | Input (без кэша) | Input (cache hit) | Output | | --- | --- | --- | --- | | Haiku 4.5 | $1 | $0.10 | $5 | | Sonnet 4.6 | $3 | $0.30 | $15 | | Opus 4.7 | $15 | $1.50 | $75 |

Output всегда в 5 раз дороже input - это общее правило. Большие "развёрнутые" ответы стоят больше, чем кажется.

Подписки vs API

  • Pro ($20/мес) - покрывает большинство личных проектов, но есть лимит по сообщениям. Sonnet 4.6 как основная.
  • Max ($100-200/мес) - вырванный из лимитов план, Opus доступен щедро. Окупается, если работаете полный рабочий день.
  • API-ключ - оплата по факту. Гибко, но при большом потреблении дороже Max.

Если у вас работа фуллтайм в Claude Code - подписка дешевле API в разы.

Антипаттерны

  • Сидеть на Opus 4.7 для копипасты JSON. Платите x15 за разницу, которую не используете.
  • Никогда не делать /compact - сессия раздувается, каждый запрос платит за всю историю.
  • Делать /clear слишком часто. Сбрасываете контекст, в котором уже разобрались - и Claude нужно перечитывать заново.
  • Огромный CLAUDE.md, который меняется каждый день - кэш не работает, платите за чтение каждый раз.

Полезные ссылки